#title 분산의 차이에 대한 검정
[[TableOfContents]]

==== F-검정 ====
 * 2개의 변수에 대해서 분산이 같은지 다른지 검정.
 * R에서는 var.test 함수 이용
 * F 통계량
  * F 통계량 = (SSA/자유도) / (SSE/자유도)
  * 체계적 분산(SSA, 집단간 분석) : 어떤 변인의 영향에 의한 분산 (각 집단 평균들이 전체평균으로 부터 떨어진 정도)
  * 오차 분석(SSE, 집단내 분석) : 표본에서 우연히 생기는 분석


{{{
a <- c(61,60,56,63,56,63,59,56,44,61)
b <- c(55,54,47,59,51,61,57,54,62,58)
var.test(a,b)
}}}

결과는 다음과 같다. 
{{{
        F test to compare two variances

data:  a and b 
F = 1.4815, num df = 9, denom df = 9, p-value = 0.5675
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
 0.3679936 5.9646717 
sample estimates:
ratio of variances 
           1.48154 

> 
}}}

결과해석
 * 가설
  * 귀무가설: 분산에 차이가 없다.
  * 대립가설: 분산에 차이가 있다. 
 * p-value가 0.5675로 유의수준 0.05보다 크므로 대립가설은 뻑. 그러므로 귀무가설 지지.

==== 로버스트한 방법 ====
 * 표본 평균 대신 표본 중위수로부터 관측치까지의 거리를 사용
 * 변수들 중 분산이 하나라도 다른 것이 있는지에 대한 검정
 * R에서는 leveneTest를 이용

{{{
a <- c(61,60,56,63,56,63,59,56,44,61)
b <- c(55,54,47,59,51,61,57,54,62,58)
x1 <- data.frame(a,b)
df1 <- stack(x1)

library("car")
leveneTest(values~ind, data=df1)
}}}

결과는 다음과 같다. 
{{{
> leveneTest(values~ind, data=df1)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  1  0.0039 0.9508
      18                         
}}}

결과해석
 * 가설
  * 귀무가설: 분산의 차이가 없다.
  * 대립가설: 분산의 차이가 있다. 
 * p-value = 0.9508 로 유의수준 0.05보다 크다. 그러므로 대립가설은 뻑남. 귀무가설 지지.

{{{
c1 <- c(3.6, 4.1, 4.0)
c2 <- c(3.1, 3.2, 3.9)
c3 <- c(3.2, 3.5, 3.5)
c4 <- c(3.5, 3.8, 3.9)
x1 <- data.frame(c1,c2,c3,c4)
df2 <- stack(x1)

library("car")
leveneTest(values~ind, data=df2)
}}}

결과는 다음과 같다.
{{{
> leveneTest(values~ind, data=df2)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  3  0.2593 0.8528
       8                 
}}}
역시 귀무가설 지지..