#title 이항분포 [[TableOfContents]] ==== 베르누이의 시행 ==== * 성공 또는 실패 * 사고 또는 무사고 * 양품 또는 불량품 * 병에 감염 또는 비감염 * 동전을 던져 앞면 나옴 또는 뒷면 나옴 * 찬성 또는 반대 ==== 베르누이 시행에 대한 가정 ==== * 각 시행은 성공과 실패의 두 가지 사건만을 가진다. * 각 시행에서 성공할 확률은 p, 실패할 확률은 q = 1 - p를 가진다. * 각 시행은 서로 독립으로 각 시행의 결과가 다른 시행의 결과에 영향을 미치지 않는다. ==== 이항분포의 정의 ==== 확률변수 X의 분포가 이항 분포를 따를 경우 X ~ Binomial(n,p)로 표기하며, 그 확률질량함수(PMF) 식은 다음과 같다. attachment:이항분포.jpg {{{n: 베르누이 시행의 반복횟수}}} {{{p: 각 시행에서 성공할 확률(0 < p < 1)}}} {{{x: n번 시행중 성공의 횟수}}} ==== 이항분포의 예 ==== * 동전던지기를 10번 시행할 경우 앞면이 나온 횟수 * 신약을 복용한 환자 중 병이 치유된 환자수 * 출하된 제품 중 불량품의 수 * 도루를 20번 시도할 경우 도루성공 횟수 ==== 확률밀도함수 ==== plot(dbinom(0:100, size=100, prob=0.2)) attachment:dbinom01.jpg plot(dbinom(0:100, size=100, prob=0.5)) attachment:dbinom02.jpg ==== 누적확률 ==== plot(pbinom(0:100, size=100, prob=0.5)) attachment:pbinom01.jpg ==== 사분위수 ==== plot(qbinom(c(0.2, 0.5, 0.8), size=10, prob=0.5)) attachment:qbinom01.jpg ==== 난수 ==== plot(rbinom(0:100, size=100, prob=0.5)) attachment:rbinom01.jpg ==== 2항분포의 적합도 검정 ==== {{{ > # 100명 중 후보 A 지지:67명, 후보 B지지:33명 이항검증 Exact binomial test > binom.test(67, 100, p = 1/2, alternative = "two.sided") Exact binomial test data: 67 and 100 number of successes = 67, number of trials = 100, p-value = 0.0008737 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.5688272 0.7608015 sample estimates: probability of success 0.67 > }}} ==== 확률계산 예제1 ==== '''1. 주사위를 두 번 던져 모두 1이 나올 확률은?''' {{{ > #주사위 2회 던짐. size=2 > #1이 나올 확률 = 1/6 > dbinom(1:2, size=2, prob=1/6) [1] 0.27777778 0.02777778 > }}} 주사위를 1회 던져 1이 나올 확률은 0.27777778이며, 2회 던져 모두 1이 나올 확률은 0.02777778(약 3%)로 확률이 낮은 것을 알 수 있다. '''2. A전염병에 걸려 회복될 수 있는 확률이 0.4일 때, 15명이 병에 걸린 경우''' - 확률변수 X의 평균과 분산? * 평균 = 15 * 0.4 = 6 (기대값) * 분산 = 15 * 0.4 * 0.6 = 3.6 (평균과 얼만큼 떨어져 있는가? SUM((값 - 평균)^^2^^) / 개수 * 표준편차 = SQRT(3.6) <평균을 구하는 다른 방법1: 그래프를 이용한 방법> 대충 6이 가장 높은 꼭지점이라는 것을 알 수 있다. attachment:problem02.jpg <평균을 구하는 다른 방법1: 난수활용> 난수를 활용해도 평균이 대충 6과 근사한다는 것을 알 수 있다. {{{ > mean(rbinom(1:10000, size=15, prob=0.4)) [1] 6.0037 > mean(rbinom(1:10000, size=15, prob=0.4)) [1] 5.9804 > mean(rbinom(1:10000, size=15, prob=0.4)) [1] 6.0008 > mean(rbinom(1:10000, size=15, prob=0.4)) [1] 6.0188 > mean(rbinom(1:10000, size=15, prob=0.4)) [1] 5.9974 > }}} - 5명이 회복될 확률 {{{ > #15명이 병에 걸림 size=15 > #5명이 회복될 확률 > dbinom(1:5, size=15, prob=0.4) [1] 0.00470185 0.02194197 0.06338790 0.12677580 0.18593784 > max(dbinom(1:5, size=15, prob=0.4)) [1] 0.1859378 > }}} - 적어도 10명이 회복될 확률 {{{ > 1 - max(pbinom(1:9, size=15, prob=0.4)) [1] 0.0338333 > }}} - 3명에서 8명이 회복될 확률 {{{ > bin <- pbinom(1:8, size=15, prob=0.4) > 3명이상이므로 2까지 빼면 된다. > bin[8] - bin[2] [1] 0.8778386 > }}} attachment:problem01.jpg '''3. 4지선다형 10문제를 임의로 찍어 3개 이하의 정답을 맞출 확률은?''' {{{ > pbinom(1:3, size=10, prob=1/4) [1] 0.2440252 0.5255928 0.7758751 > }}} 0.7758751. 약 78% 확률이다. '''4. 주사위 3개를 동시에 던질 때의 확률''' {{{ > dbinom(1:3, size=3, prob=1/6) [1] 0.34722222 0.06944444 0.00462963 > }}} 주사위 1개만 1이 나올 확률은 0.34722222 이고, 2개만 1이 나올 확률은 0.06944444 이고, 3개가 1이 나올 확률은 0.00462963이다. ==== 확률계산 예제2 ==== '''5. 총 10문제, 5지선다형(5개의 답 가운데 1개만 정답) 찍을 때 9개를 맞출 확률은?''' {{{ > dbinom(1:9, size=10, prob=1/5)[9] [1] 4.096e-06 }}} '''6. 동전을 던져서 앞면이 나오면 오른쪽으로 1단위 이동하고, 뒷면이 나오면 왼쪽으로 1단위 이동할 때''' - 처음에 원점에서 오른쪽 2단위 거리에 있다 할 때, 원점으로 돌아올 확률 {{{ > pbinom(1:10, size=10, prob=1/2) [1] 0.01074219 0.05468750 0.17187500 0.37695313 0.62304687 0.82812500 [7] 0.94531250 0.98925781 0.99902344 1.00000000 > bin <- pbinom(1:10, size=10, prob=1/2) > #오른쪽으로 4단위, 왼쪽으로 6단위 움직이면 원점 > bin[6] - bin[5] [1] 0.2050781 > #또는 > bin <- dbinom(1:10, size=10, prob=1/2) > bin [1] 0.0097656250 0.0439453125 0.1171875000 0.2050781250 0.2460937500 [6] 0.2050781250 0.1171875000 0.0439453125 0.0097656250 0.0009765625 > #왼쪽 4단위 이동 확률 또는 오른쪽 6단위 이동할 확률만 구하면 된다. > bin[4] [1] 0.2050781 > bin[6] [1] 0.2050781 }}} - 처음에 원점에 있을 때, 이 시행으로 원점에서 2단위 이내에 있을 확률 {{{ > #원점에서 2단위 이내에 있는 경우 > #왼쪽:5, 오른쪽:5 > #왼쪽:4, 오른쪽:6 > #왼쪽:6, 오른쪽:4 > bin <- dbinom(1:10, size=10, prob=1/2) > sum(bin[4:6]) [1] 0.65625 }}} '''8. 화투는 총 48장이다. 12종이며, 각 4장씩 짝을 이룬다. 1매씩 4번 뽑을 때에 송학(일)을 3장 뽑을 확률''' {{{ > dbinom(1:3, size=4, prob=4/48)[3] [1] 0.002121914 }}} 조낸 낮은 확률이다. 이런 도박은 절대 하지 말아야겠구먼..