최근 process macro를 사용하여 구조방정식을 해 달라는 분들이 많은데요. 저는 추천하지는 않습니다.
먹고 살기 위해서 의뢰 들어오면 해 주기는 합니다. 그러나 학문적으로 매우 문제가 많은 접근법입니다.
하여간 이 방법은 Baron & Kenny(1986)의 조절효과와 매개효과 보는 방법에 대한 논문에 기초하고 있습니다.
B&K 논문은 조절효과 보는 법과 매개효과 보는 법 중 조절효과 보는 법은 아직도 여전히 쓰이고 있습니다.
흔히 논문 보면 위계적 회귀분석이라 해서 1단계에는 독립변수 X를 넣고 2단계에서는 독립변수 X에 추가로 조절변수 M를 투입변수로 넣고, 3단계에서는 2단계에 X, M에다가 추가로 독립변수와 조절변수의 상호작용항 X*M을 넣어서 회귀분석을 돌리는 방법입니다.
이 단계적 회귀분석을 위계적 회귀분석이라고 논문에 많이들 썼는데 올바른 용어가 아닙니다. 이건 SPSS 커뮤니티에서만 사용하는 용어이지 학문적 용어가 아닙니다.
학계에서 위계적이라는 용어가 들어가는 경우는 제가 알기로는 위계적 회귀분석, 혼합모형에서 위계적 선형모형, 그리고 베이진안에서 위계적 베이지안 모델 이 3가지 경우뿐인데 여기서 위계적 회귀분석의 정의는 다음과 같습니다.
회귀분석에서 독립변수로 고차원의 독립변수가 들어가면 이 고차원 독립변수항에 들어가 있는 변수의 저차원도 독립변수로 들어가 있는 회귀분석의 모형을 위계적 회귀분석이라 합니다.
예를 들어
Y=b0+b1X+b2M+b3XM
의 경우 독립변수 XM은 2차 변수입니다. 그럼 여기에 들어 있는 저차원 X, M도 회귀분석 모형의 독립변수로 꼭 들어가 있어야 합니다. 그럼 이 경우 위계적 회귀분석이라 합니다.
한편
Y=b0+b1X+b3XM 또는 Y=b0+b2M+b3XM
이 경우는 처음식은 XM에 들어 있는 M이 독립변수에 들어가 있지 않고 두 번째 식은 XM에 들어있는 X가 독립변수에 들어가 있지 않습니다. 따라서 위 두 회귀분석은 위계적 회귀분석 모형이 아닙니다.
하여간 통계학에서는 조절효과는 그냥 상호작용효과에 불과합니다. 사회과학에서 거창한 이름을 붙여서 거기에 의미를 부여한 것이죠.
따라서 프로세스 매크로에서 조절효과 보는 것은 그냥 통상적으로 하는 상호작용항 만들어서 회귀분석을 돌리면 됩니다.
문제는 B&K의 매개효과 보는 방법입니다. B&K가 이럴 경우는 매개효과가 있고, 이럴 경우는 매개효과가 없다 이런 식으로 매개효과를 검증하는 방법을 제시했는데 이 방법이 논리적으로 문제가 많고 정확하게 매개효과의 크기를 구하는 방법을 제시하지 않았습니다.
따라서 프로세스 매크로에서는 매개효과 크기를 내 주고 이 매개효과가 유의적인지 아닌지 bootstrap 방식으로 검증을 합니다. 논문 읽어보면 bootstrap 방법보다는 Jackknife 방식에 가까운 것 같은데 정확하지는 않아서...
하여간 여기서는 구조방정식과 비교해서 설명을 드리겠습니다.
일단 작업하는데에서는 구조방정식과 다른 점은 프로세스 매크로에서는 독립변수, 매개변수, 종속변수를 일일이 구해야 합니다. 즉, 여러분 데이터에 독립변수, 매개변수, 종속변수가 데이터에 실제로 있어야 합니다.
이에 반해 구조방정식은 잠재변수라 해서 실제 독립변수, 매개변수, 종속변수를 구할 필요가 없습니다.
이걸 구조방정식 모양으로 그리면
구조방정식

amos에서 이 그림을 그리면 돌리면 a, b, c 값이 구해집니다. 만약 독립변수 X를 운동량이라고 하고, 종속변수 Y는 체중, 그리고 매개변수 M을 식욕, 즉 식사량이라고 하면 그럼
c: 독립변수 X에서 종속변수 Y에 미치는 직접효과, 즉 운동을 많이 하면 살이 빠지는 효과, 즉 음수(-)로 나오겠죠.
a*b: 매개변수 식욕, 즉 식사량의 매개효과가 됩니다. 즉 운동을 많이 하면 매개변수 식욕이 늘어나서 체중이 늘어나는 효과입니다. 즉 양수(+)가 나오겠죠.
그럼 운동량과 체중과의 총효과=직접효과 c+ 매개효과 a*b
이렇게 됩니다. 운동을 해서 식욕이 늘어나는 매개효과가 매우 크면 운동을 해도 오히려 총효과는 +가 되어 오히려 살이 찌게 된다는 것이죠.
여기서 매개효과(간접효과)의 크기 a*b 바로 구해집니다. 그러나 이 매개효과 a*b=0인지 아닌지, 즉 매개효과가 유의적인지 아닌지는 가설 검증은 이론적으로 쉽게 알 수가 없습니다. 그래서 이걸 하겠다고 bootstrap 방법을 쓰는 것입니다.
그럼 이걸 프로세스 매크로에서는 어떻게 할까요. 여기서도 a, b, c 값을 구해야 되겠죠. 그냥 회귀분석을 하면 됩니다. 어떻게요?

위의 그림에서 먼저 1번 회귀분석을 하고 그 다음에 2번 회귀분석을 하면 됩니다.
그럼 a, b, c가 구해지고 그 다음에는 직접효과 c, 매개효과 a*b가 바로 나오고 매개효과 검증은 bootstrap으로 합니다. 단지 프로세스 매크로에서는 구조방정식과 달리 유의확률 p 값을 구해주지 않고 신뢰구간을 구해줍니다.
왜 그렇게 하는지는 잘 모르겠고요. 뭐 어쩌고 하고 설명을 하는데 별 설득력이 없는 것 같고요.
이렇게 신뢰구간을 구해서 가설검증하는 방법은 가설검증하는 방법에서 매우 흔한 방법입니다. 가설검증 방법이 추정하는 방법보다 이론적으로 더 어려운데 실제 통계량을 구하기 힘든 경우 중심극한정리에 의해 표본수가 커지면 정규분포로 간다고 가정한 다음 정규분포 신뢰구간을 구해서 가설검증을 합니다.
하여간 이런 방식으로 좀 더 복잡한 모형의 경우에는 이렇게 됩니다.
만약 X ==> M1 ==> M2 ==> Y로 매개변수가 2개 들어 있는 모형이면
회귀분석을
1번: 종속변수 M1, 독립변수 X,
2번: 종속변수 M2, 독립변수 X, M1
3번: 종속변수 Y, 독립변수 X, M1, M2
이렇게 3번 하시면 됩니다. 그런 다음 M1의 매개효과, M2의 매개효과, M1과 M3의 매개효과 공식에 의해 각각 매개효과 크기를 구하고 bootstrap 방식에 의해 매개효과를 검증하면 됩니다.
다음은 조절변수와 매개변수가 동시에 들어간 조절된 매개효과에 대해 간단히 설명하겠습니다. 매개된 조절효과는 별 의미가 없는 것 같고요. 하는 사람도 보지를 못했고요. 조절된 매개효과도 구조방정식과 비교해서 설명하고 이해를 쉽게 하기 위해 이진변수인 성별의 경우에 대해 설명하겠습니다. 그럼 쉽게 이해가 됩니다.
'프로세스 매크로 > 구조방정식과의 차이' 카테고리의 다른 글
구조방정식 vs 프로세스 매크로1 (0) | 2023.06.27 |
---|---|
프로세스 매크로와 구조방정식 차이 (0) | 2022.11.05 |