혼합모형(Mixed Model) 13

variance component

지난번에 통계학 이론을 이해하려면 평균보다 변동을 이해하는 것이 더 중요하다고 이야기했습니다. 지난번 글은 https://blog.daum.net/dataminer9/773 여기서 한국 성인의 키에 영향을 미치는 변인으로 성인 키의 차이=성별에서 오는 차이+연령대에서 오는 차이+부모 키에서 오는 차이+(성별, 연령, 부모 키 요인으로 설명되지 않는 변동) 으로 볼 수 있다고 했는데 여기서 우리가 자녀가 2명인 경우에만 키를 조사한다고 하고, 부모는 부모의 키를 재지 않고 부모1, 부모2, 부모3, 이렇게 조사한다고 하죠. 그럼 데이터는 다음과 같은 형태로 될 것입니다. id 성별 연령대 부모 키 1 남자 30대 부모1 178 2 남자 30대 부모1 174 3 여자 20대 부모2 163 4 남자 20대 부..

고정효과와 확률효과에 대한 약간 현학적 설명: permutaion, shuffling operator

오늘은 혼합모형에서 나오는 고정효과와 확률효과에 대한 약간 현학적인 이야기를 조금 써 볼까 합니다. 너무 수학적으로 생각하지 말고 약간 새로운 세계를 느끼는 정도로 읽어 주면 좋겠습니다. 사실 일반인에게 수학은 계산입니다. calculus라고 하죠. 그러나 조금만 올라가면 이런 계산 수학은 하지 않습니다. 그래서 제가 현학적이라고 이야기했지만 약간 고등수학을 배운 분에게는 초보적인 내용입니다. 먼저 예를 하나 들어 보죠. 편의점에서 일하는 알바생의 인식에 대해서 조사를 한다고 하죠. 먼저 서울에 있는 편의점을 무작위로 10개를 뽑습니다. 또 하나는 편의점을 크게 3개로 나눠 주택가 3곳, 아파트 단지 3곳, 번화가 4곳 이렇게 편의점을 뽑아 알바생의 인식에 대해 조사한다고 생각하죠. 첫 번째와 두 번째는..

혼합모형의 이해1

혼합모형은 좀 이해하기 힘든 개념인데요. 상대적으로 최근에 나온 이론이라 보시면 됩니다. 아마 논문 쓰시는 분은 자기의 경우만 통계프로그램에서 어떻게 처리하면 되는지 알고 싶기 때문에 깊은 이해를 원하지 않을 수가 있습니다. 그러나 이런 저런 시도를 하려고 하면 내용을 좀 자세히 이해하시는 것이 좋을 것입니다. 사회과학에서 혼합모형 예로 반복측정(repeated measure) 경우가 많은데 이 반복측정 데이터는 본질적으로 패널데이터입니다. 통상 패널데이터라 하면 정부 데이터 같이 분기별, 아니면 매년 subject인 개인, 산업, 기업을 추적해서 조사하는 경우를 말하고, 반복측정 데이터는 사회과학이나 의료 등에서 실험효과를 볼 때 많이 사용하는 단어입니다. 일단 첫째, 혼합모형의 개념을 이해해야 하고요..

범주형 자료처리:이원분산분석, 조절효과

0. 지난번까지는 1원 분산분석의 경우 compare means를 사용할 수 있고, 아니면 일반선형모형(general linear model)을 사용할 수도 있고, 아니면 범주형 자료를 이진더미변수로 만들어 회귀분석을 사용하여 분석할 수도 있다고 이야기를 했습니다. 또 분산분석을 할 경우 통제변수가 있으면 이 경우는 일반선형모형에서 통제변수를 공변량으로 넣거나 아니면 회귀분석시 그냥 독립변수로 넣어서 취급하면 된다고 이야기했습니다. 오늘은 2원 분산분석시 어떻게 하는가를 이야기하고, 또 하나는 흔히 논문에서 사용하는 Baron & Kenny(1986)의 조절효과를 보는 경우에 대해서 설명하겠습니다. 다음에는 혼합모형으로 넘어가서 지금까지 이야기와 어떻게 다른지 설명하겠습니다. 1. 2원 분산분석 SPSS..

범주형자료처리2:분산분석, 일반선형모형, 회귀분석

지난번에 SPSS에서 분산분석을 일반선형모형으로 할 수 있고, 또 구체적으로 범주형 자료를 이진더미 만들어 회귀분석에서도 할 수 있다고 했습니다. 그럼 어떻게 이진변수를 만들고 또 결과를 어떻게 해석하는지 한번 보시죠. 먼저 지난번 결과를 다시 한번 보죠. 분산분석에서 평균을 보면 조직구조별 조직몰입 평균은 조직1은 평균 3.96, 조직2는 평균 3.35, 조직3은 평균 2.88입니다. 이걸 일반선형모형 결과나 회귀분석 결과에서 보면 조직1=상수+[조직구조=1]=2.883+1.076=3.96 조직2=상수+[조직구조=2]=2.883+0.465=3.35 조직3=상수=2.88 반올림 빼면 정확하게 일치합니다. 그럼 변수명을 조금 현실적으로 바꿔서 조직몰입=사회혼란, 조직구조=종교로 하고 종교=1는 기독교, 종..

범주형(명목형) 자료 처리1

댓글을 보니까 조절효과 관련해서 범주형 자료 처리하는 것에 관해 많이들 질문을 하시는 것 같습니다. 그래서 이 범주형 자료 처리를 SPSS에서 어떻게 하는지 이야기를 좀 할까 합니다. 아마 다룰 분석은 SPSS에 있는 분산분석(일원 분산분석), 그리고 일반선형모형(general linear model), 회귀분석(Regression Analysis), 그리고 혼합모형(Mixed model)이 될 겁니다. SPSS에서는 메뉴에 일반선형모형(general linear model)과 일반화 선형모형(generalized linear models)가 있는데 일반화 선형모형은 아마 여러분이 거의 할 기회가 없을 겁니다. 일반화 선형 모형은 종속변수가 정규분포가 아닌 포아송 분포라든지 지수분포 이런 변수들일 경우 ..