구조방정식.매개모형,SEM,AMOS/구조방정식,매개모형,SEM,AMOS

의뢰와 구조방정식 몇 가지 팁과 사항

학위논문통계 2016. 3. 9. 13:34

 

 

그 동안 일이 좀 생겨서 블로그를 업데이트를 못했네요. 제 홈피(hmsys.co.kr)에도 못가고요. 앞으로 자주 업데이트하겠습니다. 

 

 

방학이 끝나고 드디어 논문 시즌이 시작되었네요.

 

 

논문 의로 비용과 절차를 간단히 설명하면요.

 

석사는 기본이 40만원, 구조방정식 경우 50만원입니다. 그리고 한번 수정 추가 분석 무료로해드립니다. 그래서 예심 때 수정 사항을 한꺼번에 받아 오시는 것이 추가 비용이 안듭니다. 석사는 교수들이 별 신경을 안 쓰기 때문에 대부분 추가 분석 요구도 없고 가끔 간단한 것 추가 분석 시키는 정도입니다. 제 경험상 한 학기에 한 두분 정도 석사도 까다롭게 하는 경우가 있습니다. 교수랑 사이가 안 좋다든지, 아니면 교수들끼리 싸운다든지, 아니면 외부에서 통계 좀 아는 교수 불러오는 경우라든지. 이런 경우는 추가 분석 비용을 감오해야 합니다.

 

선불은 50% 정도 주시고 보고서 받은 다음에 나머지 잔금을 주시면 됩니다. 만약 선불로 전액을 주시면 5만원 싸게 해 드립니다.

 

박사는 기본 100만원 정도 생각해야 합니다. 예심 끝나고 교수들이 빡세게 2-3변 돌립니다. 그래서 박사는 논문 심사 끝날 때 까지 무료로 해 드립니다. 선불로 다 주시면 분석 상황에 맞춰 조금 싸게 해 드립니다.

 

 

전화는 010-4477-325입니다. 편하게 전화해 주시면 됩니다.

 

그럼 요새 가장 많이 사용되는 구조방정식에서 몇 가지 사항을 언급해보죠.

 

 

 

1. AVE와 CR(구성개념도)

최근에 확인적 요인분석에서 논문에 자주 집어 넣는 값입니다. 전에는 이런 것 안했는데요. 하여간 AMOS에서는 이 값을 구해 주지 않습니다. 따라서 책을 보고 본인이 직접 손 계산을 해야 합니다. 공식이 좀 복잡해 본인이 손으로 하기 좀 힘들겁니다. 돈 좀 주고 의뢰하시는 것이 낫습니다.

 

 

2. 구조방정식을 돌려 보면 생각보다 결과가 잘 안 나오는 경우가 많습니다. 몇 가지 팁입니다.

 

1) 먼저 상관계수 행렬을 구해 봅니다. 이건 통상 논문에도 넣은 값이니까 기본적으로 gi야 합니다. 상관계수 분석에서 +, - 기호가 상식적으로 나와야 합니다. 상관계수 부호가 상식적으로 나오지 않으면 앞에서 변수 변형하는데서 오류가 있었을 가능성이 많습니다.

 

 

2) 탐색적 요인 분석에서 기준을 좀 강화해서 부적절한 설문문항을 더 뽑아냅니다.

 

3) 인과모형 결과에서 표준오차 값이 크게 나오는 경우가 가끔 있습니다. 표준오차 값이 큰 경우 회귀계수(경로계수) 기울기가 반대로 나오거나 아니면 유의하지 않다고 나옵니다. 이런 경우는 다중공선성의 문제일 가능성이 높습니다. 이럴 경우 인과관계를 줄여서 좀 더 간결한 모형으로 만들면 원 하는 결과를 얻을 수 있습니다.

 

4) 적합도가 안 좋게 나오는 경우가 많습니다. 이럴 경우 AMOS에서 output 메뉴에서 수정지수를 체크하고 10 이상의 경우를 보여 달라고 합니다. 결과물에서 수정지수가 가장 큰 값부터 양방향 화살을 연결해서 돌리면 적합도가 상승합니다.

 

 

이 경우 적합도는 상승하지만 측정모형이나 인과모형에서 회귀계수(경로계수)값이 그 전보다 안 좋아지는 경우가 태반입니다. 즉 적합도를 올리려고 하면 회귀계수 결과가 안 좋아지고, 회귀계수 결과를 좋게 하려고 하면 적합도가 안 좋아지는 경우가 태반입니다. 일종의 상충관계(trade-off)입니다. 그래서 분석하는 사람이 어느 선에서 끊어야 합니다.

 

구조방정식 책이나 AMOS 결과물에 보면 적합도 척도와 권장 기준이 여러 개 나옵니다. 이 적합도 척도를 전무 만족시켜야 하는가? 그렇지 않습니다. 몇 개 정도 만족시키고 만족시키지 못하는 경우는 권장기준과 그 값이 큰 차이가 나지 않으면 됩니다. 그리고 적합도는 “수용 가능한 수준”이라 언급하시면 됩니다.

 

적합도라는 것이 우리가 최종 모형을 선택할 경우 고려해야 하는 하나의 기준이지 이것이 절대적인 기준이 아닙니다. 그리고 교과서에 나오는 권장기준은 굉장히 잘 나오는 경우를 말합니다. 또한 이것 권장기준이 무슨 과학적인 이론이나 수학적 증명으로 나오는 것도 아니고요.

 

구조방정식 적합도에서 가장 처음에 나오는 것이 카이제곱 값입니다. 이 검증은 유의적으로 나오지 않아야 좋은 것인데 100% 다 유의적으로 나옵니다. 일반적 통계 경험상 표본 수가 많아지면 무조건 유의적으로 나옵니다. 예를 들어 데이터가 백만개일 경우 통계 돌리지 않아도 무슨 분석을 하던 모두 유의적으로 나옵니다. 구조방정식 카이 제곱 검증도 마찬가지고요.

 

일반적인 통계 분석에서는 유의적으로 나와야 좋은 것입니다. 연구모형과 연구가설을 세우고 실증분석을 했는데 모두 유의적이지 않다고 나오면 이건 연구할 가치가 없다는 이야기이거든요. 그러나 구조방정식의 카이제곱 겸증은 반대입니다. 유의적이지 않다고 해야 좋은 것입니다. 그러나 앞에서 이야기 했듯이 100% 유의적이라 나옵니다. 그래서 요새는 카이제곱값을 사용하지 않고 자유도(df)값으로 나눈 평균 카이제곱값을 많이 사용합니다. 이 값이 1과 3 사이에 있으면 좋다고 봅니다.

 

카이제곱 검증에서 유의적으로 나오면 왜 안 좋은 것일까요> 이것을 이해하려면 통계학에 나오는 귀무가설과 대립가설 개념을 이해해야 합니다. 통상 사회과학에서 가설이라고 설정하는 것은 통계학의 대립가설에 해당합니다. 그럼 귀무가설과 대립가설을 한번 볼까요.

 

귀무가설 H0: 현재 모형이 좋다. 즉 여러분이 AMOS에서 그린 연구모형이 바람직한 모형이다.

 

대립가설 H1: 현재 모형은 더 개선될 여지가 있다. 이 말은 현재 여러분이 그린 연구모형 그림에서 더 복잡하게(현재 연구모형 그림에서 화살표나 양쪽 방향 화살표를 더 그린) 만든 모형이 더 좋다.

 

그래서 카이제곱에서 유의적으로 나오면 대립가설이 맞다고 하는 이야기이거든요. 즉 현재 그린 모형에서 더 복잡하게 만들어 이 카이 제곱 검증이 유의적이지 않게 나올 때까지 해야 합니다.

 

구조방정식 모형에서 나오는 카이 제곱 검증을 이해하려면 귀무가설과 대립가설이 정확하게 뭔지를 먼저 이해해야 합니다. 구조방정식의 조절효과 검증도 마찬가지입니다.

 

 

3. 직접효과, 간접효과, 매개효과, 총효과

 

간접효과와 매개효과의 개념이 좀 햇갈리는데요. AMOS에서는 매개효과는 나오지 않습니다. 이 개념을 정리하면

 

1) 직접효과: 두 변수간의 일단계 인과관계를 말합니다. 즉, A==>B입니다.

 

2) 매개효과: 두 변수 사이에 하나의 변수(매개변수)가 들어간 모양입니다. 즉, A==>B==>C 일 경우 A는 독립변수, B는 매개변수, C는 종속변수가 됩니다. 이때 매개효과는 두 개의 경로 계수의 곱인 a*b가 됩니다. 매개효과의 의미는 A변수 한 단위(표준 회귀계수일 경우 1 시그마)가 상승할 때 C는 a*b 단위(표준회귀계수일 경우 a*b 시그마) 상승한다. 이런식으로 해석됩니다.

 

3) 간접효과 : 매개변수가 하나가 있든 두 개가 있든 관계없습니다. 두 변수 사이에 매개변수가 들어가기만 하면 간접효과라 합니다. 즉, A==>B==>C==>D 경우. 세 개의 회귀계수 값 a*b*c를 곱하면 간접효과가 됩니다.

 

4) 총효과: 간단하게 직접효과+간접효과가 됩니다.

 

이 간접효과(매개효과)를 검증하는 경우 AMOS에서는 bootstrap 이라는 일종의 재표본(resampling) 기법을 사용합니다. 이 재샘플 기법에는 Jackknife 기법과 bootstrap 기법이 있는데 제 지금 기억으로는 jackknife 기법이 처음 나온 방법이고 좀 더 개선된 것이 bootstrap인 걸로 압니다. 틀리면 나중에 확인해서 다시 수정하겠습니다.

 

하는 방법은 간단합니다. 잭나이프의 경우 만약 데이터가 100개가 있다고 하면 이 100개 중 99개를 랜덤으로 계속 뽑아냅니다. 99개 뽑아낼때 마다 여기에 해당하는 평균 값을 구합니다. 거기서 나온 평균 값을 또 평균한 값을 원래 집단의 평균의 추정치라고 생각합니다. 이 재표본 기법은 분포를 가정할 필요가 없기 때문에 비모수 기법이고 기존의 통계 방법론보다 조금 좋다고 하는데 그런 것까지는 잘 모르겠습니다. 그러나 이상치(outlier)로 인하여 통계 추정이 d이상하게 나오는 현상은 좀 줄여 줄 수 있을 것 같습니다. AMOS에서는 이론적 간접효과 검증이 아직까지는 좀 안 좋다고 생각해서 비모수 기법인 bootstrap을 사용하는 것 같습니다.

 

검증하는 방법은 간단합니다. output 메뉴에서 계수 차이를 체크하고요. bootstrap에서 90%나 95% 신뢰구간 구하라고 체크합니다. 그리고 결과 보면 신뢰구간의 하한과 상한 값이 나옵니다. 즉 (하한, 상한) 이런 식이 되는 것이죠. 이 신뢰구간이 0을 포함하면 이 경우 간접효과는 유의적이지 않습니다. 즉 실제 간접효과는 없다고 판단하는 것이죠. 만약 이 신뢰구간이 0을 포함하지 않으면 90% 신뢰구간이면 유의수준 0.1에서 간접효과는 유의적이라고 하고, 95% 신뢰구간을 구하하고 했다고 유의수준 0.05에서 간접효과는 유의적이라 판단합니다. 최근 AMOS 버전에는 p 값을 바로 구해 줍니다. 현재 제가 AMOS 20을 쓰는데 버그가 많네요. SPSS 20도 버그가 많고요. IBM이 인수하면서 전에 SPSS에서 일하던 사람을 제대로 고용한 것 같지 않습니다.

 

신뢰구간과 가설검증은 다른 이론인데 이렇게 해도 되는가하는 의문이 있을 수 있습니다. 원래 가설 검증 이론은 수학적으로 좀 어렵습니다. 즉 수학적으로 푸는 것이 잘 안되는 경우가 많습니다. 이럴 경우 신뢰구간을 구해 가설검증 이론에 적용해서 하는 방법이 있습니다. 신뢰구간과 가설검증은 동전의 양면과 같은 점이 있거든요.

 

 

5. 조절효과

 

조절변수가 연속형 변수일 경우 구조방정식에서는 조절효과를 검증할 수 없다고 보면 됩니다. 이 경우 SPSS에서 회귀분석에서 위계적 회귀분석을 적용하면 됩니다. 이것은 여기 블로그 조절효과 편에서 보시면 자세히 나옵니다.

 

구조방정식에서 연속형 변수의 조절효과를 보시고 싶으면 이 경우 변수의 평균 값을 구해 이 평균값보다 작으면 0. 크면 1로 이진형(더미) 변수를 새로 생성해서 이 이진 변수를 조절변수로 설정해서 하시면 됩니다.

 

하여간 구조방정식에서는 연속형이 잘 안되기 때문에 흔히 조절효과 볼 경우 범주형이 대부분인 표본의 일반적 특성(인구사회 특성, 또는 건강 관련 특성, 직무관련 특성)을 조절변수로 많이 설정합니다.