구조방정식.매개모형,SEM,AMOS/구조방정식,매개모형,SEM,AMOS

구조방정식1

학위논문통계 2014. 6. 23. 17:41

 

 

 

 

1. 오늘은 현재 우리나라 사회계열에서 가장 많이 쓰는 모형인 구조방정식 모형에 관해서 이야기해보죠. 만약 구조방정식을 의뢰할 경우 학과에서 최근에 통과된 구조방정식 논문을 보내주시는 것이 좋습니다. 학과마다 하는 것도 다르고 요구하는 것도 달라서요.

 

 

 

사실 통계학과에서는 구조방정식 모형에 대해 잘 모릅니다. 옛날에 다변량 분석책에서 경로분석(path analysis)(인과모형 부분)에 대해 간단한게 설명나온 것은 본 적이 있는데 하여간 통계학과에서는 그렇게 심각하게 다루는 분야는 아닙니다. 사실 조절효과를 통계학과에서 물어보면 잘 모릅니다. 회귀분석에서 교호항, 상호작용항이 들어가는 모형이라야 알아 먹습니다.

 

 

 

하여간 이 구조방정식 모형 이론에 대해서 엄밀하게 서술한 책을 읽어보지 않아서 제가 확실을 가지고 이야기할 수 없는 부분이 많이 있습니다. 그런 점은 고려하시고요.

 

 

 

 

오늘은 몇 가지 간단한 개념들을 소개하는 수준으로 하겠습니다.

 

 

일단 구조방정식 모형을 본인이 직접하고 싶다면 먼저 가장 쉬운 책을 사서 보시기 바랍니다. 쓸데없이 양이 많은 책으로 공부하시지 말고요.

 

 

 

제가 처음 시작하는 분에게 권하는 책은

 

 

조현철 저;“3일만에 끝낼 수 있는 구조방정식모델” 도서출판 석정

 

이라는 책입니다. 통계적으로 틀린 이야기가 제법 있지만 그런 식은 신경쓰지 마시고 구체적으로 어떻게 하는지 배우시기 바랍니다.

 

 

 

본인이 직접 설문조사한 데이터가 있으면 모형을 최대한 간단히 해서 돌려보시기 바라고요. 예를 들어 직무스트레스에 하위영역 변인이 7개 정도 있다면 여기에서 두 개 정도만 고르고 그리고 각 하위영역 변인에 해당하는 설문문항도 간단하게 2개 정도만 골라서 돌려보시기 바랍니다. 그래서 일단 자신감을 가진 다음에 조금씩 자세한 책들을 보시고요.

 

 

 

 

 

 

 

2. SEM 모형

 

 

 

구조방정식은 경제학과에서 연립방정식 모형(SEM: simultaneous equation model, structural equation model)로 오랜 전부터 사용해 왔던 모형입니다. 이걸 사회과학에서 차용해서 매개변수가 있는 경우에 적용을 한 것 같고요. 이걸 처음 사회과학에 도입한 사람이 모형식을 그리스 문자로 쓰는 바람에 이 구조방정식 모형은 대부분 그리스 문자로 모형을 많이 씁니다. 보기 불편하죠.

 

 

 

경제학과에서는 어떤 경우에 이런 모형을 쓸까요? 예를 들어 우리나라 GDP에 관해서 예측을 많이 하잖아요. 이런 예측이 잘되야 경기을 활성화하지 아니면 안정정책을 쓸지 결정되는 것이고, 또 세금이 얼마나 거둬들일지 판단이 되고 거기에 따라 정부지출도 달라지고 그런다는 것이죠.

 

 

 

그래서 국내총생산에 영향을 미치는 여러 가지 경제 변수를 독립변수로 설정한다는 것이죠. 그러나 경제가 이해하가 힘든게 이런 경제변수들 간에 서로 간에 또 영향을 주고 영향을 받고 그런다는 것이죠. 국내총생산의 독립변수로 들어간 변수가 다른 변수들 간에서는 종속변수의 역할을 한다는 것이죠. 그래서 현상을 완전히 이해하기 위해서는 이러한 여러변수들의 관계를 정의하는 식을 여러개 만들고 모형을 추정해야 한다는 것이죠.

 

 

 

 

구조방정식에서 부분매개 모형을 한번 생각해보죠. 이건 직접효과와 간접효과 둘 다 있는 복잡한 모형입니다.

 

 

 

직접효과: 독립변수==> 종속변수

 

 

간접효과: 독립변수==> 매개변수, 매개변수==>종속변수

 

 

그래서 이걸 회귀식으로 쓰면 3개의 식이 되는 연립방정식 모형이 됩니다.

 

 

 

 

 

2. 부분매개, 완전매개, 직접효과, 간접효과

 

 

 

직접효과가 없는 경우를 완전매개 모형이라 합니다. 독립변수==매개변수==>종속변수

 

이런 관계의 모형을 이야기 하죠.

 

 

 

부분매개모형을 할건가 아니면 완전매개모형을 할 건가는 이건 전적으로 분석하는 사람 마음입니다. 완전매개는 부분매개의 특수한 경우입니다. 즉 직접효과가 0인 경우인 것이죠. 직접효과가 0임을 판단하는 것은 연구자의 사전적 판단입니다. 문제는 사회과학에서 직접효과라는 것이 그리 명확치가 않다는 것이죠.

 

 

 

직접효과와 간접효과에 대해 간단히 설명하면 예로서 AI을 가지고 설명하죠. 만약 AI가 다른 숙주를 걸c치지 않고 인간에게 바로 접촉해서 병을 일으키면 이건 직접효과가 되는 것이고요. 또 AI가 다른 동물이나 식물을 걸쳐서 인간에게 영향을 미치게 되면 이건 간접효과, 매개효과가 되는 것이죠.

 

 

 

만약 직접효과가 없다면, 그러나 AI 자체를 통제하기 힘들면 완전매개의 경우 중간 숙주인 매개변수를 통제하면 됩니다. 그러나 부분매개의 모형인 경우 매개변수를 통제하는 것만으로는 충분하지 않다는 것이죠. AI 원인체가 매개변수인 숙주를 통하지 않고도 인간에게 직접적으로 영향을 미칠 수가 있으니까요.

 

 

 

구조방정식 모형이 아무리 복잡해도 부분적으로 뜯어보면 전부 완전매개와 부분매개의 모양으로 되어 있습니다.

 

 

 

 

 

 

3. 외생변수, 내생변수

 

 

 

 

앞에서 설명한 바와 같이 매개변수는 한편으로는 독립변수에 대해서 종속변수의 역할을 하고(독립변수==> 매개변수), 한편으로는 종속변수에 대해서는 독립변수의 역할을 합니다(매개변수==> 종속변수).

 

 

 

오로지 독립변수의 역할만 하는 변수를 외생변수라 합니다. 그러나 종속변수의 역할도 하는 것을 내생변수라 하고요. 그래서 매개변수도 독립변수와의 관계에서 종속변수의 역할을 하기 때문에 매개변수도 내생변수입니다.

 

 

 

사실 이 개념자체가 중요한 것은 아닌데 문제는 구조방정식을 돌릴 때 이 내생변수에는 항상 에러항(오차항)을 붙여야 합니다. 이것을 하지 않으면 에러가 생기니까 꼭 주의를 하셔야 합니다.

 

 

 

 

 

4. 관찰변수, 잠재변수

 

 

관찰변수는 여러분이 데이터에 실제로 값을 가지고 있는 변수입니다. 설문문항 변수들이 대표적인 관찰변수입니다. 잠재변수는 여러분이 논문주제로 삼는 변수입니다. 즉 구성개념에 해당하는 변수입니다. 이 변수는 설문지에서 직접 물어보지 않습니다. 따라서 이 연구대상 변수에 대한 직접 관찰한 값은 없습니다. 단지 이 연구변수를 측정하기 위해 구체적인 내용을 물어본 설문문항 변수가 몇 개 있을 뿐입니다.

 

 

 

예를 들어 직무스트레스 중 경제적 스트레스가 연구변수의 하나라고 하면 “경제적 스트레스가 어느 정도 됩니까” 이렇게 물어보지 않는다는 것이죠. “같은 직종에 일하는 사람보다 월금이 더 적다고 생각하는냐”, “회사내의 다른 사람보다 경제적 보수가 낮다고 생각하느냐”, “현재 월급으로 생활하기가 불편하느냐” 이런 식으로 경제적 스트레스에 관한 여러 가지 구체적인 설문문항을 만들어서 설문지를 작성합니다.

 

 

 

그런 다음 구조방정식 모형이 아니면 해당 설문문항의 평균값을 구해 경제적 스트레스의 값으로 정의하거나 아니면 탐색적 요인분석을 해서 요인점수를 가지고 경제적 스트레스의 값으로 정의합니다.

 

 

 

구조방정식에서는 경제적 스트레스에 관한 구체적인 값을 구하지 않습니다. 경제적 스트레스를 잠재변수로 하고, 여기에 해당하는 설문문항을 관찰변수로 해서 설문문항에서 경제적 스트레스와 화살로 연결을 시켜줍니다.

 

통상 구조방정식에서는 관찰변수는 사각형으로, 잠재변수는 타원형으로 그립니다.

 

 

 

 

 

 

5. 큰 모형과 작은 모형

 

 

그런데 구조방정식에서 연구변수는 잠재변수로 구체적인 값을 구하지 않는다고 했는데 이걸 평균을 구해 관찰변수로 만들어 구조방정식을 하는 경우가 있습니다.

 

 

 

이것은 현재 우리나라 사회과학 저널에서 많이 하는 방법인데요. 예를 들면 이런 것입니다.

 

 

 

직무스트레스가 조직의 효과성에 영향을 미치고 이게 또 이직의도에 영향을 미친다고 해보죠. 간단히 완전매개 모형입니다. 이직의도는 원래 단일 척도라 별 문제가 없는데 하여간 직무스트레스에는 물리환경 스트레스, 인간관계 스트레스, 경제적 스트레스 등 3가지가 있고, 조직효과성에는 직무만족, 조직몰입 두가지 하위 영역이 있다고 해보죠.

 

 

 

그래서 연구변수는 직무스트레스의 3가지 독립변수, 조직효과성에서 2가지 매개변수, 그리고 최종 종속변수인 이직의도 1개의 종속변수가 있습니다.

 

 

 

그래서 매개변수인 직무만족에서는 어떤 종류의 스트레스가 영향을 미치는지, 그리고 조직몰입에는 어떤 종류의 스트레스가 영향을 많이 미치는지 그리고 최종적으로 이 직무만족과 조직몰입이 어느 정도 이직의도에 미치는지 이런 것을 알고 싶다는 것이죠. 그럼 3가지 직무스트레스, 2가지 조직효과, 마지막 이직의도 이 6가지 변수가 잠재변수, 즉 연구대상 변수입니다.

 

 

 

 

이렇게 하면 좀 복잡하니까 연구대상 변수를 좀 큰 변수로 잡습니다. 즉 직무스트레스, 조직효과성, 이직의도 이 3개를 연구대상 변수로 잡아 직무스트레스가 조직효과성에 미치는 영향, 그리고 조직효과성이 이직의도에 미치는 영향 이런 것을 보고 싶다는 것이죠. 그러면 이 직무스트레스, 조직효과성을 잠재변수로 놓게 됩니다. 그리고 평균값으로 해서 구한 3가지 직무스트레스, 직무만족과 조직몰입의 2가지 변수를 구조방정식 모형의 관찰변수로 사용한다는 것이죠.

 

 

 

어느 것이 나은가? 이런 것은 없죠. 단지 이렇게 큰 변수를 만들어 모형을 간단하게 하면 사실 이건 분석할 의미가 별로 없는 것이죠. 인과관계야 뻔한 것이고, 나온 결과 갖고 어떤 정책적 대안이나 경영대책 같은 것을 세울 수가 없는 것이죠.

 

 

 

이직의도를 줄이기 위해 직무만족과 조직몰입 어디에 더 신경을 써야 하고 또 직무만족과 조직몰입을 상승시키기 위해 물리환경, 인간관계, 경제적 보상 스트레스 중 어디에 더 신경을 써야 하는지 이런 이야기 정도는 나와야 하는데 이건 그냥 직무스트레스를 줄이면 조직효과성이 높아지고 이에 따라 이직의도가 줄어든다는 뻔한 이야기만 하고 있는 것이거든요.

 

 

 

그런데도 한국의 사회과학 저널에서는 이런 쓸데없는 논문짓만 하고 있다는 것이죠. 그리고 별 중요하지 않은 설문도구의 신뢰도와 타당도 분석으로 논문을 떡칠을 하고 있고요.

 

 

 

 

다음은 측정모형, 인과모형, 그리고 포화모형, 내포모형 등등 계속 이야기를 해 보겠습니다.