#title 위계선형모델(Hierarchical Linear Model) [[TableOfContents]] ==== 개요 ==== * 학교와 학생과 같이 위계를 갖는 자료들에 대한 분석 * 집단내의 분석, 집단간의 분석 * 개인의 변인, 집단의 변인 ||다층모형(Multilevel Models 또는 위계선형모형(Hierarchical Linear Models: HLM))은 자료내의 표본이 상위집단에 속해있는 자료를 분석하는 모형입니다. 각 개인(학생, 회사원) 자료가 조직(학교, 회사) 자료에 속해 있는 자료를 다층자료라고 합니다. 이런 자료에 다층모형을 적용하면 각 개인의 결과변수를 개인특성과 조직특성, 그리고 개인과 조직 사이의 상호작용으로 설명할 수 있습니다. 개인의 결과를 개인특성으로서만 설명하는 것이 아니고 개인을 둘러 싼 맥락효과(환경)까지 고려한다는 점에서 다층모형은 매우 자연스런 모형입니다. 상위수준 자료는 반드시 조직수준일 필요는 없으며 개인일 수도 있습니다. 예를 들면 여러 환자는 의사에 속하는 다층구조를 이룰 수 있으며 환자의 치료효과와 같은 결과변수는 환자특성, 의사특성, 환자와 의사 사이의 상호작용으로 설명될 수 있습니다.|| -- http://koreanpsychology.or.kr/enterschool/bbs_view.asp?Ipage=5&Iseq=4595 ==== 데이터 ==== attachment:위계선형모델/hlm_data_0.zip [http://txcdk.unt.edu/iralab/sites/default/files/hlm_data_0.csv 원본] {{{ hlm <- read.csv("c:\\rdata\\hlm_data_0.csv") head(hlm) }}} 결과 {{{ > head(hlm) schid minority female ses mathach size schtype meanses 1 1224 0 1 -1.528 5.876 842 0 -0.428 2 1224 0 1 -0.588 19.708 842 0 -0.428 3 1224 0 0 -0.528 20.349 842 0 -0.428 4 1224 0 0 -0.668 8.781 842 0 -0.428 5 1224 0 0 -0.158 17.898 842 0 -0.428 6 1224 0 0 0.022 4.583 842 0 -0.428 }}} * 학생수준(level-1) * minority: 민족성(minority=1, other=0) * female: 성별(female=1, 0=male) * ses: 학생의 배경(부모의 교육수준, 직업, 수입) * mathach: 수학성적 * 학교수준(level-2) * size: 학생수 * schid: 학교식별자 * schtype: 설립유형(sector), 공립 또는 카톨릭=1(public or catholic) * meanses: 학생 ses 평균 ==== 위계 선형 모델(Hierarchical Linear Model) ==== {{{ library("nlme") #run the intercepts-and slope-as-outcomes model ctrl <- lmeControl(opt='optim'); model2 <- lme(mathach~meanses*ses + schtype*ses, random=~ses | schid, data=hlm, control=ctrl) summary(model2) VarCorr(model2) }}} 참고: lme() 함수에서 아래와 같은 메시지가 나올 경우 lmeControl(opt='optim')를 이용하여 제어해준다. {{{ Error in lme.formula(mathach ~ meanses * ses + schtype * ses, random = ~ses | : nlminb problem, convergence error code = 1 message = iteration limit reached without convergence (10) }}} 결과 {{{ > summary(model2) Linear mixed-effects model fit by REML Data: hlm AIC BIC logLik 46526.21 46595 -23253.11 Random effects: Formula: ~ses | schid Structure: General positive-definite, Log-Cholesky parametrization StdDev Corr (Intercept) 1.545996356 (Intr) ses 0.007858279 0.004 Residual 6.063711572 Fixed effects: mathach ~ meanses * ses + schtype * ses Value Std.Error DF t-value p-value (Intercept) 12.093477 0.2023257 7022 59.77232 0.0000 meanses 3.304206 0.3871145 157 8.53548 0.0000 ses 2.902136 0.1479089 7022 19.62110 0.0000 schtype 1.199009 0.3072555 157 3.90232 0.0001 meanses:ses 0.835240 0.2714756 7022 3.07667 0.0021 ses:schtype -1.576624 0.2241463 7022 -7.03391 0.0000 Correlation: (Intr) meanss ses schtyp mnss:s meanses 0.216 ses -0.002 -0.167 schtype -0.676 -0.344 -0.007 meanses:ses -0.165 0.093 0.281 -0.051 ses:schtype -0.004 -0.051 -0.680 0.007 -0.357 Standardized Within-Group Residuals: Min Q1 Med Q3 Max -3.15472213 -0.72530262 0.01492044 0.75492174 2.99227664 Number of Observations: 7185 Number of Groups: 160 > VarCorr(model2) schid = pdLogChol(ses) Variance StdDev Corr (Intercept) 2.390105e+00 1.545996356 (Intr) ses 6.175254e-05 0.007858279 0.004 Residual 3.676860e+01 6.063711572 > }}} * intraclass correlation:집단 내 상관계수, 집단 사이에서 발생하는 설명 변인 변량의 비율 * 0.06103636 = 2.390105e+00 / (2.390105e+00+3.676860e+01) * (Intercept): 집단 간 변화 정도(학교간 변량) * Residual: 결과의 변인의 집단 내 변화 정도(학교내 변량) * random effect에서 각 학교별(schid)의 각 학생의 배경(ses)은 수학성적과의 상관계수(Corr)가 0.004로 별 관계가 없다. Fixed effects의 다른 변인들은 p-value는 0.05 이하로 유의미하다. 즉, 수학성적에 영향을 끼친다. ==== 참고자료 ==== * attachment:위계선형모델/hlm_data_0.zip * http://txcdk.unt.edu/iralab/hierarchical-linear-modeling * http://125.60.48.13/home4/dl_files/edu/015/EM0038776.pdf --> 결과해석