구조방정식.매개모형,SEM,AMOS/구조방정식,매개모형,SEM,AMOS

측정모형,인과모형, 내포모형, reduced, full, saturated model

학위논문통계 2014. 8. 4. 13:31

 

 

1. 측정모형과 인과모형(구조모형)

 

구조방정식 모형은 측정모형과 인과모형으로 나눠집니다. 측정모형은 실증분석 전에 설문도구 신뢰도와 타당도 분석을 하는 모형이고, 즉 확인적 요인분석을 하는 것입니다, 인과모형은 여러분이 연구모형에서 세운 연구가설을 검증하는 모형입니다.

 

지난번 글에서 우리나라 박사논문의 구조방정식을 한 모형을 다시 가져와서 보지요.

 

 

 

 

 

그림 오른쪽 아래 회색부분만 따로 떼어 내면 설문문항 권유, 재방문, 추천, 재이용이 충성도라는 구성개념을 제대로 측정하는지 분석하는 측정모형으로 돌린 것입니다. 즉 확인적 요인분석을 한 것입니다.

 

가운데 빨간색으로 둘러쳐진 부분이 인과모형입니다. 여기에서 나온 결과를 보고 연구가설을 검증하는 것입니다.

 

 

신뢰도와 타당도 분석에서 썼지만 여기서 간단히 다시 한번 쓰겠습니다. 요인분석에는 탐색적 요인분석과 확인적 요인분석이 있습니다. 통계학 교과서에 나오는 요인분석은 탐색적 요인분석입니다. 그리고 SPSS 메뉴에 있는 요인분석도 탐색적 요인분석입니다. 통계학 다변량 교과서에서 확인적 요인분석을 아무리 찾아도 헛고생입니다. 그래서 통계 전공한 사람에게 확인적 요인분석을 물어봐도 헛고생이고요. 사회과학, 특히 경영학쪽 다변량 분석 책을 보시면 확인적 요인분석에 관한 내용을 찾을 수 있습니다. 확인적 요인분석은 SPSS에서 안되고 AMOS를 가지고 돌려야 합니다.

 

 

확인적 요인분석과 탐색적 요인 분석은 이론적으로 조금 차이가 있습니다. 그걸 떠나 어떤 경우에 확인적 요인분석을 하고 탐색적 요인 분석을 하는지 그걸 아시는 것이 더 중요합니다.

 

 

일반적으로

 

 

1) 통계가 약한 과에서는 탐색적 요인분석이든 확인적 요인 분석이든 하지를 않습니다. 흔히 Cronbach 알파값을 구하는 것으로 끝납니다. 이건 설문문항간에 상관관계가 높은지(내적일치도) 보는 것입니다.

 

 

2) 통계를 많이 하는 곳은 요새는 석사학위에 탐색적 요인분석을 요구하는 것이 태반입니다.

 

 

3) 연구모형을 매개변수가 들어가서 구조방정식을 하는 경우 탐색적 요인분석과 확인적 요인 분석을 다 하는 경향이 있습니다. Baron & Kenny의 매개효과 검증을 하는 경우 AMOS를 사용하지 않고 SPSS에서 회귀분석만 하니까 이 경우는 탐색적 요인분석으로 끝나는 경우가 많습니다.

 

 

이게 현재 우리나라 학위논문에서 다루는 설문문항 신뢰도와 타당도 분석입니다.

 

 

이걸 떠나 기본적으로 분석에 깔린 기본 생각을 보면 탐색적 요인분석과 확인적 요인 분석은 완전히 차이가 있습니다. 용어 자체에서 보면 알겠지만 탐색적 요인 분석은 검증되지 않는 설문도구를 사용하는 경우이고, 확인적 요인분석은 이미 검증된 설문도구나 아니면 주관적으로 판단하거나, 이론적으로나 설문문항과 구성개념간의 연결성이 분명할 경우 사용합니다.

 

 

이게 어떤 경우에 문제가 생기냐 하면은 경영학과에서 어떤 대상의 속성을 구성개념으로 하여 설문도구를 만들 때 문제가 생깁니다. 탐색적 요인분석으로 하면 결과가 잘 안나오는 경우가 많습니다.

 

 

이런 이야기입니다. 우리가 식당을 평가할 때 다양한 측면을 고려합니다. 이런 속성에 음식의 품질, 위생, 종업원 서비스 품질, 식당 시설, 가격, 음식의 맛 등이 있을 수 있습니다. 이런 것을 구성개념으로 하고 설문문항을 개발하여 측정을 해야 합니다.

 

 

그런데 문제는 식당이 고급 식당이면 통상 음식 품질이 좋고, 위생이 좋고, 서비스품질도 좋고 식당 시설도 좋고, 가격은 비싸고, 반대로 식당이 저급 식당일 경우 반대의 경우가 생기겼죠.

 

 

그래서 음식의 품질, 위생, 서비스 품질, 식당 시설,, 등등 여러 가지 구성개념에 해당하는 설문문항을 개발해도 이 문항들의 상관관계가 매우 높게 됩니다. 그래서 탐색적 요인분석을 하면 설문문항들이 자신에 해당하는 구성개념에 명확하게 포함되지 않고 잘 분별이 되지 않은 경우가 많습니다.

 

 

그러나 확인적 요인분석의 경우는 이미 설문문항이 어떤 구성개념에 해당한다는 것을 이미 설정을 합니다. 우리가 사전정보로 이미 알고 있다는 것이죠. 그래서 특정 설문문항이 엉뚱한 구성개념에 포함되는 불상사가 일어나지 않는다는 것이죠.

 

 

따라서 식당 속성과 같은 경우 탐색적 요인분석 결과가 좋지 않으면 이 탐색적 요인분석은 논문 내용에서 제외하고 확인적 요인분석을 하면 됩니다. 그러나 사회과학교수들이 이걸 받아 들이지를 못하죠. 탐색적 요인분석과 확인적 요인 분석을 왜 하는지 모르기 때문이죠. 그리고 탐색적 요인분석의 결과가 좋으면 확인적 요인 분석을 할 필요가 없습니다. 탐색적 요인분석을 제대로 했다면 확인적 요인 분석은 결과가 잘 나올 수 밖에 없습니다. 확인적 요인 분석에서 결과가 제대로 나오지 않았다면 탐색적 요인분석에서 부적절한 설문문항 제거 기준을 너무 약하게 잡았기 때문입니다.

 

 

2. 기초 사전 지식

 

 

두 변수간의 인과관계를 설정할 때 통상 다음과 같은 간단한 수식을 씁니다.

 

Y=b0+b1*X+e

 

종속변수=상수+b1*독립변수+오차항

 

이 경우 독립변수 X가 종속변수 Y에 영향을 미친다 이렇게 되죠. 즉 결과에 해당하는 Y는 왼쪽에 쓰고, 원인에 해당하는 독립변수는 오른쪽에 쓰는 것이 관행입니다. 오차항은 통제되지 않는 확률부분, 아니면 크게 중요하지 않아 통제하지 않아도 되는 확률 부분이 되겠죠.

 

만약 b1=0 이라면, 즉 독립변수가 종속변수에 아무런 영향을 주지 않는다면 모형은 그냥

 

Y=bo+e

 

되겠고, 상수항, Y 절편 b0는 사실상 평균 개념이 되겠습니다.

 

 

여기서 이야기 하고 싶은 것은 처음 모형

 

M1: Y=b0+b1*X+e

 

은 위의

 

M0: Y=b0+e

 

 

을 포함하고 있다는 사실입니다. 즉 b1=0인 경우인 모형 M0는 모형 M1의 특수한 경우라는 것이죠. 그래서 이렇게 표현할 수 있습니다.

 

 

 

 

이걸 그래프로 그리면 다음과 같습니다.

 

 

 

 

 

위의 M0에서는 독립변수와 종속변수간에 화살표가 없습니다. 즉 인과관계가 없다는 것이죠.

 

그러나 아래 M1에서는 독립변수와 종속변수간에 화살표가 있습니다. 즉 인과관계가 있을수 있다는 것을 가정, 혹은 가설로 내세운 모형입니다. 물론 여기에는 인과관계가 없다고 나올 수도 있죠.

 

이렇게 모형간에 크고 작고 관계가 있는 경우를 내포모형(nested model)이라고 하고 작은 모형 M0을 reduced model, 큰 모형 M1을 full model 이라고 합니다.

 

내포모형이 아닌 경우는 어떤 것들이 있을까요? 간단합니다.

 

M0: Y=b0+b1*X1+e

 

M1: Y=b0+b1*X2+e

 

 

이 경우는 M0가 큰지 M1이 큰지 이야기를 할 수 없습니다.

 

내포모형에서 가장 큰 모형을 우리가 상상하면 모형이 데이터를 완전히 완벽하게 설명하는 모형을 생각할 수 있습니다. 이런 모형은 포화모형(saturated model)이라 합니다.

 

그럼 실전으로 한번 들어가 볼까요. 앞에서 경제적 스트레스를 측정하기 위해 설문문항 2개를 만들었습니다. 이런 경우 모형은 어떻게 되고 AMOS에서 그림은 어떻게 될까요? 모형은 다음의 두 가지 회귀식으로 구성됩니다.

 

 

설문1=b1*경제적 스트레스+오차1

 

 

설문2=b2*경제적 스트레스+오차2

 

  AMOS에서 그림을 그리면

 

 

 

 

 

 

 

이렇게 되고요, 설문1과 설문2는 실제 설문응답을 받았기 때문에 관찰변수입니다. 그래서 네모로 그리고요. 구성개념인 경제적 스트레스는 이 변수에 대한 값을 설문에서 받지 않았기 때문에 잠재변수, 그래서 타원형으로 그립니다.

 

오차와 설문을 연결하는 직선에 1이 들어 있는 것은 위 모형의 오차항을 보면 1*오차 이런 형태입니다. 그래서 당연히 1의 값이 들어가는 것이죠.

 

지금 한 것이 바로 경제적 스트레스라는 구성개념을 측정하기 위해 설문문항 2개를 개발하였을 경우 설문도구의 신뢰도, 타당도 분석을 위해 확인적 요인분석을 한 것입니다.