#title 평균과 비율은 같은 같은 것 평균(산술평균)과 비율은 같은 개념입니다. 다음의 5개의 숫자가 있습니다. 1,2,3,4,5 평균은 (1+2+3+4+5) / 5 = 3 입니다. 표준편차는 sqrt(((1-3)^2 + (2-3)^2 + (3-3)^2 + (4-3)^2 + (5-3)^2)/(5-1)) = 1.58113883 입니다. 3이상의 숫자는 몇%인가요? 5개 중에 3개니까 60%(3/5) 입니다. 그러므로 3이상의 값은 1, 3미만의 값은 0으로 놓고 평균을 구하는 것과 같이 계산 해보겠습니다. 1,2,3,4,5 -> 0,0,1,1,1 평균은 (0+0+1+1+1) / 5 = 0.6 입니다. 표준편차는 sqrt(((0-0.6)^2 + (0-0.6)^2 + (1-0.6)^2 + (1-0.6)^2 + (1-0.6)^2)/(5-1)) = 0.5477225575 입니다. 표준오차(SE)는 어떠한가? 다음은 평균의 표준오차와 비율의 표준오차 공식입니다. attachment:평균과비율은같은같은것/se.png 평균과 비율은 같은 같은 것이라고 했는데, 오차 공식이 다르다. 그럼 다른 것 아닌가요? 일단 계산 해보겠습니다. * 평균의 표준오차 = 1.58113883/sqrt(5) = 0.7071067811 * 비율의 표준오차 = sqrt(0.6 * (1-0.6) / (5-1)) = 0.2449489743 음.. 그럼 비율의 오차를 평균의 표준오차를 구하는 공식으로 구해볼까요? 비율의 표준오차 = 0.5477225575/sqrt(5) = 0.2449489743 앗! sqrt(0.6 * (1-0.6) / (5-1)) 와 같이 계산한 것과 같은 결과입니다. 평균과 비율은 같은 겁니다. ''주의'' 일반적으로 비율의 표준오차는 sqrt(p*(1-p)/n)으로 계산합니다. n-1로 하느냐, n이냐는 n이 작을 때는 문제가 되지만 n이 충분히 크면 문제가 되지 않습니다. 아래는 정규분포하는 평균=100, 표준편차=100의 랜덤값입니다. n이 커짐에 따라 모집단의 표준편차와 표본의 표준편차의 차이가 n=2000 정도되면 거의 차이가 없음을 볼 수 있습니다. attachment:평균과비율은같은같은것/e_1.png 중요한 것은... 평균과 비율의 개념이 같은 것이라는..