프로세스 매크로/조절된 매개효과

매개효과 조절된 매개효과 다중집단 조절효과

학위논문통계 2022. 12. 26. 09:49

 

 

1. 매개효과(간접효과)

 

매개효과의 정의는 다음과 같습니다.

 

 

그림에서 직접효과=c, 매개효과=a*b, 총효과=직접효과+매개효과=c+(a+b)

 

여기서 a, b, c는 표준회귀계수입니다.

 

이걸 논문에서 표로 정리하면 됩니다.

 

여기서 매개효과 크기를 구하는 것은 바로 됩니다. 그러나 구한 매개효과가 유의적인지 아닌지는 여전히 알 수 없습니다. 즉, 다음 가설

 

귀무가설 H0: 구한 매개효과 (a*b)가 0이다.

대립가설 H1: 구한 매개효과 (a*b)가 0이 아니다.

 

이 가설을 검증하려면 Bootstap을 해야 합니다.

 

즉, 매개효과 크기를 알려면 구조방정식 회귀계수 값을 보고 손으로 직접 계산해도 되지만 이 매개효과가 유의적인지 검증하려면 Boostrap을 돌려야 합니다. 이 경우 매개효과 크기도 손으로 직접 계산하지 않아도 AMOS에서 자동적으로 구해줍니다.

 

 

 

Tip:

 

매개효과를 구하려고 하는데 에러 메시지가 나오는 경우가 종종 있습니다. 표준회귀계수를 체크하지 말라는 메시지가 뜨죠. 이럴 경우 어떻게 할까요.

 

 

먼저 Analysis properties에서 indirect, direct & total effects를 체크하지 않고, 표준회귀계수를 체크한 다음 구조방정식 경로계수를 구합니다. 그럼 구한 회귀계수 값을 보고 매개효과 크기를 계산해 낼 수 있습니다.

 

그 다음 단계는 반대로 indirect, direct & total effects를 체크를 하고 표준회귀계수를 체크하지 않습니다. 그럼 앞 단계에서 손으로 구한 매개효과 크기가 유의하지 아니지 그 결과물이 나옵니다.

 

위 내용은 프로세스 매크로로 마찬가지입니다. 프로세스 매크로의 대부분 결과물은 프로세스 매크로 프로그램을 쓰지 않고도 직접 회귀분석을 해도 대부분 산출할 수 있습니다. 통계 이론을 잘하는 사람의 경우 어려운 일이 아닙니다. 프로세스 매크로 매뉴얼에서

 

 

위 그림에서 위 부분 그림은 프로세스 매크로에서 적용할 모형 번호이고 아래 그림은 실제 회귀분석할 때 사용될 독립변수입니다. 아래 그림에서 XW와 MiV 상호작용항을 직접 구해 데이터에 넣은 다음 회귀분석을 하면 프로세스 매크로에서 나온 결과물과 동일한 결과물을 구할 수 있습니다.

 

단지 매개효과나 조절효과가 유의한지 아닌지 알 수 없기 때문에 Bootstrap 방식을 하는 것에 불과합니다.

 

 

 

2. 다중집단분석, 조절효과, 조절된 매개효과

 

 

AMOS에서 조절효과를 보려면 먼저 조절변수 W를 이진더미변수로 만든 다음 다중집단분석을 하여야 합니다.

 

조절변수 W는 성별과 같이 처음부터 이진더미변수인 경우도 있고, 연령대와 같이 범주를 2개로 다시 리코딩해야 하는 경우가 있습니다. 예를 들어 연구문제가 MZ세대에 관심이 있다고 하면 30대 이하는 0, 40대 이상은 1로 이진더미 변수로 만들어야 합니다.

 

한편 조절변수가 연속형 변수이면 평균을 기준으로 평균 이하는 0, 평균 이상은 1로 처리하면 됩니다. SPSS에서 기초 기술통계 구할 때 표준화 메뉴를 체크하면 표준화된 조절변수가 데이터에 추가됩니다. 그럼 0 이하를 0, 0 이상을 1로 리코딩하면 쉽게 이진더미변수로 만들 수 있습니다.

 

 

 

그럼 다중집단분석이 뭘 하는지 한번 보죠.

구체적으로 운동시간, 식욕, 체중간의 구조방정식을 예로 하죠. 그럼 이 관계는 논리적으로 다음의 모형이 됩니다.

 

<그림 운동, 식욕, 체중간의 모형>

 

그럼 논리적으로 운동기간이 길면 체중이 줄어드니까 c는 음수(-), 운동을 하면 식욕이 증가하니까 a는 양수(+), 식욕이 늘면 체중도 느니까 b도 양수(+)를 예상할 수 있습니다.

 

그리고 운동시간과 체중간의 관계에서 식욕은 부정적인 매개효과, 즉 체중을 늘리는 예상할 수 있습니다. 즉 매개효과=a*b=양수를 예상할 수 있습니다.

 

1) 조절변수 W가 이진변수일 경우

 

그럼 조절변수 W는 성별이라고 하죠. 즉, 위의 운동시간, 식욕, 체중간의 구조방정식 관계가 남자와 여자에 따라서 어떻게 다른지 분석하고 싶은 것입니다. 이 작업이 다중집단분석이고 성별의 조절효과를 보는 것입니다.

 

복잡하게 생각하지 말고 전체 데이터 집단을 남자집단, 여자집단 2개로 나눠 각각 구조방정식을 돌리면 됩니다. 그럼 남자집단과 여자집단 각각에 대해 a, b, c 값을 구해주고 남자의 경우 매개효과와 여자의 경우 매개효과는 각각 a*b를 구해주면 됩니다.

 

그런데도 왜 복잡하게 다중집단분석이라는 것을 하는 것일까요. 조절효과는 회귀계수, 즉 직선의 기울기에서 유의적인 차이가 있는지를 보는 것입니다. 즉 아래 그림에서

 

<그림 남자 경우>

<그림 여자 경우>

즉, a1=a2, b1=b2, c1=c2에 대해서 가설 검증을 해 줍니다. 표로 나타내면

 

인과관계 남자(W=0) 여자(W=1) z p
표준회귀계수 표준회귀계수
a a1 a2

b b1 b2

c c1 c2

매개효과 a1*b1 a2*b2

 

즉, 구조방정식에서 다중집단분석을 하면 다음의 값들을 구할 수 있습니다.

 

1) 각 집단별 구조방정식 결과

 

2) 집단간 회귀계수의 차이, 즉 성별의 조절효과 검증 값(표에서 z값과 p )

 

3) 각 집단별 매개효과 즉 남자의 매개효과 a1*b1, 여자의 매개효과 a2*b2가 유의적인지 검증해 줍니다.

 

4) 그러나 남자의 매개효과와 여자의 매개효과에서 차이가 있는지는 검증해 주지 않습니다.

 

이 분석은 다이어트 전공하는 분이나 헬스장 운영하는 분에게는 매우 중요한 분석입니다. 회원이 여성이나 남성이나 따라 조언이 달라질 수 있기 때문입니다.

 

 

 

2) 조절변수 W가 다범주인 경우

 

이 부분은 프로세스 매크로 하는 분들은 꼭 참조하시기 바랍니다. 조절된 매개지수 개념을 이해하려면 이 부분을 잘 보셔야 합니다.

 

AMOS에서 구조방정식을 할 경우 다범주인 경우 다시 이진더미변수로 치환을 해야 합니다. 해도 되는데 소위 사후검증이라는 것을 제공해주지 않아 별 도움이 안됩니다.

 

프로세스 매크로는 조절변수가 이진더미변수나 다범주, 그리고 연속형일 경우 다 할 수 있습니다. 그러나 결과값이 구조방정식과 많이 다릅니다.

 

 

조절변수 W가 연령이라고 하죠. 그럼 10대=1, 20대=2, 30대=3, 40대=4, 50대=... 이렇게 코딩되었다고 하죠.

 

그럼 각 연령별대로 구조방정식 결과 a, b, c를 구할 수가 있습니다. 그러나 프로세스 매크로에서 관심을 가지고 있는 것은 각 연령별대로 매개효과의 경향성을 보자는 것입니다. 예를 들어 연령이 높아질수록 식욕의 부정적 효과가 증가하는지, 아니면 부정적 효과가 하락하는지 이런 것에 관심을 갖는 것입니다.

 

그래서 식욕의 연령별대로 매개효과 크기를 표로 만들어 보죠

 

 

조절된 매개지수 10대(W=1) 20대(W=2) 30대(W=3) 40대(W=4) 50대(W=5)
조절된 매개지수가 + 0.025 0.029 0.027 0.031 0.047
조절된 매개지수가 - 0.041 0.038 0.040 0.031 0.025

 

 

표의 위 부분은 전반적으로 식욕의 부정적 매개효과가 조절변수 W(연령)의 값이 커질수록 매개효과의 크기가 증가합니다. 반대로 아래부분의 경우 조절변수 W(연령)의 값이 낮아질수록 매개효과의 크기가 줄어듭니다.

 

따라서 위 관계를 회귀분석식처럼 쓸 수 있습니다.

 

 

Y(매개효과 크기)=a+b*W(연령)

 

 

이 회귀관계식에서 기울기를 나타내는 b를 조절된 매개지수(index of moderated mediation)라고 합니다.

 

즉, 조절된 매개지수는 매개효과 크기가 조절변수 값에 따라 상승하는지 하락하지는 보는 기울기입니다.

 

이 조절된 매개지수 b가 유의적으로 나오면, 즉 통계적으로 0이 아니라도 판정이 나면 조절된 매개효과가 유의적이라고 말합니다.

 

그리고 조절된 매개효과 b가 유의적이라고 나와도 위의 표의 각 매개효과 크기가 유의하다는 것을 의미하지 않습니다. 또 조절된 매개효과가 유의하지 않아도 각 개별 매개효과 크기는 유의할 수 있습니다.

 

 

만약 연령이 40대까지 매개효과가 상승하다가 50대부터 매개효과가 하락하는 경우는 어떻게 될까요.

 

이런 경우 어쩔 수 없습니다. 회귀분석에서는 2차항까지를 독립변수로 만들어 처리하면 되지만 프로세스 매크로에서는 그런 것까지 해 주지 않습니다. 이 경우 기울기 b가 유의하지 않다, 즉 b=0이라고 검증을 해 줍니다.

 

 

 

3) 조절변수 W가 연속형이라면

 

앞에서 이야기한 것처럼 조절변수 W가 연속형이라면 AMOS 구조방정식을 사용하려면 연속형 변수를 평균을 중심으로 ‘저집단’, ‘고집단’으로 이진더미변수로 만들어 해결해야 합니다.

 

프로세스 매크로를 사용한다면 연속변수 그래도 사용하시면 됩니다.

 

만약 조절변수 W가 연속형이면 취할 수 있는 값이 이론적으로 무한대입니다. 그래서 분석은 조절변수 W가 측정 값 w에 따라 다 달라집니다. 즉, W=w일 때 매개효과 크기를 구해야 하는데 이건 사실상 불가능합니다.

 

 

만약 조절변수가 스트레스 정도라고 하죠. 이 스트레스를 LIket 척도로 측정했다고 하면 스트레스 값은 설문문항의 평균값으로 하니까 이 스트레스가 취하는 값이 무지무지하게 많아 사실상 연속형 변수의 성격을 띕니다.

 

 

그래서 프로세스 매크로 이론책에 보면 조건부(conditional) 분석이라는 말을 많이 씁니다. 앞에서 이야기한 것처럼 별 것 없습니다. 조절변수 W의 특정 값 w에 따라 분석 결과물이 다른 것을 말하는 것입니다. 앞의 연령별에서 각 연령별에 따라 매개효과를 구하는 것처럼요.

 

 

그런데 이 연속형이면 특정 값이 너무 많이 결과물을 내 주지를 못합니다. 그래서 나온 편법이 조절변수 W=m, m+시그마, m-시그마 세 가지 경우에 매개효과 크기와 매개효과가 유의한지를 보여 주거나 아니면 특정 percentile에 따라 매개효과 크기와 매개효과가 유의한지를 보여 줍니다. 이건 프로세스 매크로에서 매뉴로 선택할 수 있습니다.

 

조절변수 어떤 범위에서 매개효과가 유의한지 또 어떤 범위에서 유의하지 않는지 보여주는 기법으로 Johnson-Neyman 기법이 있습니다. 다음 그림을 보면

 

 

여기서 wt가 조절변수이고 y축이 매개효과를 나타냅니다. 그리고 그림의 색깔 있는 부분이 [95% 신뢰구간 하한, 95% 신뢰구간 상한]입니다.

 

그래서 이 구간이 0을 포함하지 않으면(파란색) 이 조절변수 범위에서는 매개효과가 유의적이고, 이 구간이 0을 포함하면(분홍색) 이 조절변수 범위에서는 매개효과가 유의하지 않다고 판단합니다.