실험계획/혼합모형(mixed model)

설문데이타로 혼합모형 확률효과로 분석하기

학위논문통계 2023. 9. 23. 06:05

오늘은 설문지 데이터를 가지고 확률효과를 넣은 혼합모형을 쓸 수 없을까 하는 문제를 다뤄 보겠습니다.

 

 

모형은 편의상 가장 단순한 단순회귀분석으로 하죠. 독립변수가 여러개 들어가는 다중회귀분석도 마찬가지입니다.

 

독립변수는 변혁적 리더십, 종속변수는 자기효능감입니다. 즉 상사의 변혁적 리더십이 조직원의 자기효능감에 영향을 미치는가 하는 문제입니다.

 

그럼 모형식은 다음과 같습니다.

 

자기효능감=b0+b1*변혁적 리더십+오차

 

이걸 SPSS에서 회귀분석 메뉴에 가서 분석해도 되고 지난번 글에서 이야기했지만 혼합모형 메뉴에 가서 고정효과만 사용해서 분석해도 됩니다.

 

그럼 여기에 어떻게 하면 확률효과를 더 참가할 수 있을까 하는 문제입니다. 다음과 같이 하면 됩니다.

 

자기효능감=(b00+b01)+(b10+b11)*변혁적 리더십+오차

 

여기서 b01b11는 하나의 값이 아니라 정규분포를 따르는 확률변수입니다. b01 --> Normal(0, s1), b11 --> Normal(0, s2)입니다. 그래서 분산 s1s2가 확률효과를 나타내는 모수입니다.

 

 

그럼 위 식은 어떻게 해석이 되는가?

 

해석은 다음과 같습니다. 직원의 자기효능감과 상사의 변혁적 리더십과 선형적 관계에 있다. 그러나 이 관계는 직원 개개인마다 편차가 있다. 즉 선형식에서 y절편과 기울기가 직원마다 조금씩 다 다르다 이렇게 해석이 되는 것입니다.

 

이런 개인의 편차가 크다면, 즉 분산 s1과 분산 s2가 크다면 혼합모형을 쓰는 것이 좋고, b0b1을 더 정확히 추정할 수 있고, 만약 개인의 편차가 무시할 정도이면 혼합모형이 아닌 그냥 단순한 회귀분석을 하는 것이 더 좋습니다.

 

그럼 어떻게 하는지 한번 볼까요. 일단 ID라는 변수를 하나 더 만들어야 합니다. 100명 조사했다면 ID=(1, 2, 3, .... ,100) 이렇게 변수하나를 더 만들어야 합니다. 그냥 설문대상자의 식별자에 해당하는 변수입니다. 특별한 의미를 가는 변수가 아니고요.

 

그럼 혼합모형 메뉴를 열고요.

 

제일 위 개체에 ID 변수를 지정합니다. 지금 조사는 동일 시점에서 설문조사한 데이터이기 때문에 아래 메뉴의 반복(repeated measure)은 생략합니다. 그리고 반복 공분산 유형은 해당사항이 없기 때문에 생략합니다. 그래서 계속메뉴를 누르면

 

종속변수에 자기효능감을 넣고, 공변량은 독립변수가 연속형 변수인 카리스마 리더십이기 때문에 공변량에 지정합니다. 독립변수가 여러개이면 여기에 다 지정을 하면 됩니다. 그런 다음 고정을 선택하면

 

카리스마 리더십을 지정합니다. 이걸 선택함에 따라 여기서 b00b10을 계산해 줍니다.

 

그 다음 변동을 지정하면

 

위 부분에 카리스마 지정하는 것은 기울기에서 개인간의 변동을 나타내는 b11s2을 구하라는 이야기이고 절편포함에 체크한 이유는 상수항에서도 확률효과가 있다는 것을 알리는 것입니다. 그리고 위의 공분산 유형은 비구조적을 선택하시면 됩니다.

 

여기서 공분산은 두 개의 확률효과, , 상수항과 기울기에 있는 b01b11 이 두 개의 정규분포의 공분산 행렬을 구하라는 이야기입니다. 마지막 밑에 ID를 선택합니다.

 

그 다음 앞으로 가서 통계량 부분에서 고정효과에 대한 모수 추정값공분산 모수 검증을 선택합니다, 그럼 다음과 같은 결과를 구할 수 있습니다.

 

그럼 다음과 같은 결과를 얻습니다.

 

y 절편은 b00=1.3585, 기울기 즉 회귀계수 b10=0.6747로 나오고

 

오차항은 분포는 Normal(0, 0.6475)이고 y 절편은 확률효과 정규분포 b01 --> Normal(0, 0.000), b11 --> Normal(0, 0.000173), b01b11과의 공분산은 -0.116917, 즉 상수항이 상수항 평균보다 높은 사람은 기울기가 평균 기울기보다 약간 낮게 나오고, 상수항이 평균보다 약간 낮은 사람은 기울기가 평균 기울기보다 조금 높게 나옵니다.

 

여기서 spss에서 에러가 좀 있는 것 같습니다.

 

이 결과를 그냥 회귀분석 결과와 비교해보죠. 혼합모형으로 하는 것이랑 거의 차이가 없죠.