#title 확률이론 [[TableOfContents]] [http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9788971898376&orderClick=LAH&Kc= EXCEL 활용 현대 통계학, 강금식, 정우석, 박영사]를 정리했다. ==== 개요 ==== * 불확실성하에서 의사결정을 하기 위해서는 모집단의 특성을 예측하는데 확률을 부여하거나 어떤 결과가 발생하는 데 따르는 위험을 분석하고 이를 최소화하는데 확률을 적용한다. * 확률과 추리통계학과는 역의 관계, * 확률은 모집단으로부터 표본을 판단(연역) * 추리통계학은 표본으로부터 모집단에 대한 추론(귀납) ==== 사상과 표본공간 ==== * 실험(experiment)이란 유사한 조건하에서 관측이나 측정을 유발하는 과정 * 기본결과(basic outcom)이란 동전의 앞면 또는 뒷면처럼 동시에 발생할 수 없는 결과 * 표본공간(sample sapce)란 실험의 실시로 관찰할 수 있는 가능한 모든 기본결과(단일사상)의 집합 * 사상(event)란 확률실험의 실시로 얻는 하나 이상의 기본결과들의 집합 ==== 복합사상(compound event) ==== * 합사상(union of event)란 표본공간을 이루는 모든 사상 가운데 적어도 하나의 사상에 속하는 모든 단일사상들의 집합 * 교사상(intersection of event)란 표본공간을 이루는 모든 사상에 공통적으로 속하는 단일 사상의 집합 * 여사상(complement of A)이란 표본공간에 속하는 모든 단일 사상 중에서 특정 사상에 속하지 않는 단일사상의 집합 ==== 확률의 개념 ==== 객관적 확률 * 고전적 방법(이론적 방법) * 한 클래스에 학생은 100명이다. 이 중에서 남자는 40명이다. 1명 추출할 경우 여자인 확률은? * 60/100 = 0.6 * 경험적 방법(상대도수 개념 이용) * 과거에 납품한 900상자의 부품 가운데 불량품은 100상자였다. 이 공급자가 납품할 상자가 불량품일 확률은? (귀납) * 100/900 = 0.11 * 경헙적인 방법의 확률이 높게 나타는 경향이 있다. ==== 확률의 공리와 법칙 ==== 공리 * 공리1: '''0 <= P(A) <= 1''' * 공리2: '''P(S) = 1''' * 공리3: '''P(A or B) = P(A) + P(B)''' 법칙 * 여사상의 법칙(공리3으로부터) * '''P(A or B) = P(A) + P(A^^c^^) = 1''' * '''P(A^^c^^) = 1 - P(A)''' * 덧셈 법칙 * '''P(A∪B) = P(A) + P(B) - P(A∩B)''' * P(A∩B)를 빼는 이유는 공통부분에 대한 중복 계산을 피하기 위함 * 두 사상이 상호배타적이라면 중복되는 부분이 없다는 것. 그러므로 P(A∩B) = 0 이 된다. * 조건확률(결합확률표 참고) * 두 사상이 밀접한 관계가 있어서 한 사상의 확률이 다른 사상의 발생에 영향을 받는 경우 * 종속적인 경우는 이자율과 유가 변동과 주가, 비복원추출(sampling without replacement) 등 * '''P(A|B) = P(A∩B) / P(B)''' * 어떤 사상 B가 이미 발생했다는 조건하에서 A가 발생할 확률 * 비종속적인 경우는 코스피 지수와 내일 날씨가 맑은 것, 복원추출(sampling with replacement) 등 * '''P(B|A) = P(B) 또는 P(A|B) = P(A)''' * P(A) 또는 P(B)는 무조건 확률(unconditional probability), 주변 확률(marginal probibility) 또는 단일 확률(simple probiblility) 라고 한다. * 곱셈법칙(두 사상의 결합확률 = P(A∩B)) * 조건확률 P(A|B) = P(A∩B) / P(B) * 양변에 P(B)를 곱하면 P(B)P(A|B) = P(B)P(A∩B) / P(B) * '''P(A∩B) = P(B)P(A|B)''' * 만약, A와 비가 동시에 발생하거나 연속적으로 발생할 때 두 사상의 결합확률은 P(A∩B) = P(A)P(B) * 결론적으로.. * P(A|B) = P(A) 또는 P(B|A) = P(B) * P(A∩B) = P(A)P(B) * 이 두 조건이 성립하지 않으면 두 사상은 종속적으로 보아야 한다. ==== 독립시행과 확률 ==== 어느 축구팀의 승 확률은 4/9, 패 확률은 3/9, 무 확률은 2/9이다. 5승 2무 3패 할 확률은? 전체 경우의 수는 10! / (5!2!3!) ||승||패||승||무||패||승||무||승||패||승|| 위의 경우의 수 (4/9)^^5^^(2/9)^^2^^(3/9)^^3^^ 그러므로 확률은.. (10! / (5!2!3!)) * (4/9)^^5^^(2/9)^^2^^(3/9)^^3^^ ==== 분할표 ==== || ||백인||흑인||합계|| ||남자||35||5||40|| ||여자||15||25||40|| ||합계||50||30||80|| 주변확률 * 주변확률은 분할표(contingency table)의 주변(margin)에 나타나기 때문에 붙여진 이름 * P(백인) = 50/80 = 0.625 * P(흑인) = 30/80 = 0.375 * P(남자) = 40/80 = 0.5 * P(여자) = 40/80 = 0.5 결합확률 * P(백인∩남자) = 35/80 * 40/80 = 0.4375 * P(백인∩여자) = 15/80 * 40/80 = 0.1875 * P(흑인∩남자) = 05/80 * 40/80 = 0.0625 * P(흑인∩여자) = 25/80 * 40/80 = 0.3125 결합확률분포 || ||백인||흑인||합계|| ||남자||0.4375||0.0625||0.5|| ||여자||0.1875||0.3125||0.5|| ||합계||0.625||0.375||1.0|| 종속적인 경우의 조건 확률 * 남자와 흑인은 종속적인가? * P(남자) = 40/80 = 0.5 * P(흑인|남자) = P(흑인∩남자) / P(남자) = 0.0625 / 0.5 = 0.125 (남자일 때 흑인일 경우) --> 종속적이다. * 만약 P(남자) = P(흑인|남자) 라면 두 사상은 독립이다. ==== 베이즈 정리 ==== 개념 * 사전확률(prior probablility) * 사후확률(posterior probability) * 추가적인 표본 정보에 입각하여 사전확률을 경신하여 사후확률로 만드는데 베이즈 정리(bayes' theorem)가 이용됨 * 베이즈 정리는 사전확률과 조건확률을 유도 * P(L1|D) = P(L1)P(D|L1) / P(L1)P(D|L1) + P(L2)P(D|L2) * P(L2|D) = P(L2)P(D|L2) / P(L1)P(D|L1) + P(L2)P(D|L2) 예제 제품의 품질은 생산라인에 따라 다르다. 다음과 같이 양품율이 주어졌다고 하자. || ||양품률||불량품률||생산율|| ||L1||0.99||0.01||0.55|| ||L2||0.95||0.05||0.45|| * 불량품이 발견된 경우 각 라인 L1, L2의 사후 확률은? * 사전확률 L1 = 0.55, L2 = 0.45 * P(L1|불량품) = 0.55(0.01) / (0.55 * 0.01 + 0.45 * 0.05) = 0.1964 * P(L2|불량품) = 0.45(0.55) / (0.55 * 0.01 + 0.45 * 0.05) = 0.8036