구조방정식.매개모형,SEM,AMOS

구조방정식 조절효과 모형선택1

학위논문통계 2022. 9. 10. 10:31

지난번에 구조방정식에서 가설 검증(정확하게는 직접효과 가설)이 모형선택의 문제로 환원될 수 있다는 것을 보여 주었습니다. 물론 이 가설 검증을 모형선택의 문제로 하는 사람은 없습니다. 직접효과 가설검증은 t 검증이지만 모형선택의 문제에서 가설 검증은 X2 검증이 됩니다.

 

구조방정식에 나오는 또 다른 모형선택의 예로서는

 

흔히 다중집단 분석이라고 하는 조절효과를 보는 경우입니다. 조절효과를 검증하는 z 검증을 할 수 있지만 모형선택 검증을 할 수도 있습니다. 또 조절효과 검증을 하기 전에 예비적으로 측정동일성 검증을 요구하는 경우도 있는데 이 경우는 모형선택 검증을 해야 합니다.

 

측정동일성 검증은 석사 논문 수준에서는 요구하지 않는데 간혹 박사논문 수준에서는 심사위원이 요구할 수 있습니다.

 

거의 모든 통계 방법론에는 사전 가정 사항이 있습니다. 가장 대표적인 것이 정규분포 가정이죠. 또는 회귀분석에서는 오차항이 정규분포뿐만 아니라 독립성, 등분산 이런 조건을 만족시켜야 합니다.

 

이런 가정을 전부 다 만족시키면 이론적으로는 매우 좋지만 간혹 만족시키지 못하면 별 대책이 없다는 것이죠.

 

측정동일성 검증이 대표적인 예입니다. 완벽하게 측정동일성 검증을 통과하는 예는 거의 없습니다.

 

측정동일성 검증이 뭐냐 하면 예를 들어 남녀간의 연구모형에서 회귀계수들이 동일한가 아니면 차이가 있는가? 즉, 일반 회귀분석에서 조절효과가 있는지 보는 문제에서 분석 전에 남녀간의 변수들이 동일한 가를 먼저 알아 봐야 합니다.

 

예를 들어 스트레스가 소진에 미치는 영향, 즉 스트레스 ==> 소진 인과관계를 검증한다고 하면 남녀 간에 스트레스와 소진이 동일한 변수라는 것이 전제가 되어야 합니다.

 

이 이야기는 확인적 요인분석에서 남녀간에 따로 확인적 요인분석을 해서 확인적 요인분석에서 나오는 값들이 통계적으로 동일하다는 것이 전제가 되어야 합니다.

 

확인적 요인분석에서 나오는 대표적인 값이 회귀계수, 또 잠재변수인 스트레서와 소진간의 공변량 값, 그리고 오차항의 분산 등이 있습니다. 이 값들이 남녀간에 동질해야 잠재변수인 스트레스와 소진이 남녀간의 동질하다고 볼 수 있고, 이 이후에야 스트레스 == 소진 인과관계에서 회귀계수가 남녀간에 동질한지 아니면 다른지 조절효과를 검증할 수 있다는 것입니다.

 

문제는 이 회귀계수, 공변량, 오차항의 분산 이것을 다 만족시키는 경우는 거의 없다는 것이죠. 그럼 어쩔 수 없이 표 조작을 하는 수밖에 없습니다.

 

이런 문제는 한국 교수들이 자기들이 직접 데이터를 다루지 않아서 무슨 문제가 있는지 잘 모르거나 다른 논문 심사하는 과정에서 뭔가 새로운 것을 보면 아는체 한다고 요구하는 경우가 있습니다.

 

지금 김건희 논문에 대해서 말이 많은데 제가 보기에는 김건희 논문은 아마 대필 논문일겁니다. 학위논문뿐만 아니라 저널 논문까지요.

 

제일 심각한게 박사 논문이 아니라 실제 통계 분석을 안하고 다른 사람 논문의 통계표를 그냥 빼긴 저널 논문입니다.

 

 

간혹 설문조사해서 통계 분석한 것이 아니라 데이터 없이 가짜로 통계 분석을 요구하는 분들이 있습니다.

 

이런 경우 골치 아프게 통계 분석하지 않고 그냥 마음대로 통계표 만드니까 더 쉬울 거라 생각하지만 그렇지 않습니다. 통계 제대로 아는 사람은 개념이나 공식 등을 알기 때문에 마음대로 만들지 못합니다.

 

예를 들어 탐색적 요인분석에서 고유값, 변동설명력, 누적변동설명력의 개념과 공식 등이 있습니다. 여기에 맞춰 조작을 해줘야지 그렇지 않으면 전문가가 보면 조작했는지 바로 알 수 있습니다. 또 많이 쓰이는 크론바 알파 같은 경우도 탐색적 요인분석 결과 보면 대강 어떤 값이 나올지 예측이 됩니다. 또 설문문항이 많으면 이 값이 커지고 설문문항이 적으면 이 값이 작아지는 단점이 있습니다. 설문문항이 많은데 크론바 알파 값이 작고, 설문문항이 적은데 크론바 알파 값이 크면 이건 거의 100% 조작입니다.

 

하여간 그래서 교수들이 측정동일성은 좀 요구를 안했으면 합니다. 심사위원이 하라고 하면 할 수 밖에 없는데 거의 100% 조작을 해야 합니다.

 

 

또 하나 모형선택 문제가 나오는 경우가 잠재성장모형입니다. 패널데이타인 경우 자주 쓰는 구조방정식 모형이 잠재성장모형입니다.

 

잠재성장모형은 분석 상 2단계가 있습니다. 첫 단계가 연구변수들이 매년 어떻게 변하는 가 밝히는 단계가 있고, 두 번째 단계가 실제 가설검증 단계인 각 연구변수들의 매년 변화가 서로 어떻게 영향을 미치는지 구조방정식 인과모형을 적용하는 단계입니다.

 

 

1. 조절효과 회귀계수 검증

 

예를 들어 스트레스 ==> 소진 ==> 이직의도 이런 구조적 인과관계가 남녀간에 차이가 있는지 검증한다고 하죠.

 

1) 그럼 먼저 File ==> Data files ==> Grouping variable에서 성별 변수를 지정하고 Group Value에서 남성, 여성 코딩 값을 지정합니다.

 

 

2) 그 다음

 

view ==> analysis properties ==> critical ratios for differences

을 체크해주시면 됩니다. Bootstrap은 하실 필요가 없습니다. 또한 Model 부분도 손 될 필요가 없습니다.

 

만약 효과분석까지 원하시면 Bootstrap 메뉴까지 지정해야 유의수준 p 값이 나옵니다.

 

 

3) 남녀별로 회귀계수 레벨을 지정합니다.

 

남자: 스트레스 ==> 소진:a1, 소진 ==>이직의도: a2

여자: 스트레스 ==> 소진:b1, 소진 ==>이직의도: b2

 

 

 

즉, 다음 그림과 같이 하시면 됩니다.

 

 

 

첫 번째 그림은 연구모형이고요

 

두 번째 그림은 남자의 경우이고 세 번째 그림은 여자의 경우입니다. 실제 작업할 때 변수 이름에 남, 여를 넣으시면 안됩니다. 편의를 위해서 제가 일부러 남, 여를 넣은 것입니다.

 

 

이렇게 레벨을 정한 후 돌리면 됩니다.

 

그럼 결과물에서 Estimate에서 남녀간의 회귀계수 값이 나오고, pairwise parameter comparisons을 보면 각 남녀간의 회귀계수 차이에 대한 z 검증 값이 나옵니다. p값은 안 나오니까 표준정규분포 z값에 따라 검증하시면 됩니다.

 

 

 

2. 조절효과 모형 선택

 

모형선택의 문제로 보고 싶으면

 

앞의 단계를 다 한 다음 model에서 default 말고 추가로 모델을 하나 더 만듭니다. 이름은 아무렇게 붙여도 됩니다. 추가 모델을 M0라고 하고 Default 모델을 M1이라고 이름 붙이죠.

 

그럼 모델 M0에서는 다음과 같은 제한을 둡니다.

a1=b1, a2=b2

 

모델 M1은 그냥 놔둡니다. 즉, 아무런 제한이 없습니다.

 

지난 글에서 이야기했지만 제한이 있으면 간단모형, 단순모형 M0이 되고 제한이 없을수록 복잡모형이 됩니다.

 

이렇게 한 다음 돌리면 model comparison에서 x2 검증값을 볼 수 있습니다.

 

그럼 가설은

 

귀무가설 H0: 단순모형, 간단모형 M0가 맞다. 즉 남녀간에 회귀계수 차이가 없다.

 

대립가설 H1: 복잡모형 M1이 맞다. 최소한 a1이 b1이랑 다른거나 아니면 a2가 b2랑 다르다.

 

이렇게 됩니다.

 

그래서 X2 검증에서 유의적으로 나오면 뭔가 남녀간에 회귀계수에서 차이가 있다고 결론내리고 그럼 구체적으로 a1가 b1이 다른지, 아니면 a2가 b2가 다른지, 아니면 a1, a2가 b1, b2랑 모두 다른지 알려면 앞에서 한 pairwise parameter comparison 결과물을 확인하시면 됩니다.

 

유의하지 않다면 이건 a1=b1, a2=b2가 맞다는 이야기이고 그럼 우리는 남녀 구별해서 상세히 분석할 필요가 없다는 이야기가 됩니다.

 

 

지금 이 이야기는 회귀분석에서 F검증과 t 검증과의 관계랑 똑 같습니다.

 

회귀분석에서 F검증은 최소한 회귀계수 하나는 0이 아니다라는 대립가설을 검증하는 것이고, t 검증은 구체적으로 어떤 회귀계수가 0이 아닌지 검증하는 것입니다.

 

그럼 다음에는 조절효과 검증 전에 사전에 하는 측정동일성 검증에 대해서 알아보겠습니다.