Baron & Kenny 매개,조절효과/조절효과

조절효과의 수학적 모형 이해와 혼합모형

학위논문통계 2021. 2. 3. 11:46

오늘은 조절효과의 수학적 모델에 대해서 설명을 좀 할까 합니다. 너무 어렵게 생각할 필요가 없습니다. 중고등학교때 배운 단순 1차 직선 식에 불과합니다. 여기서 혼합모형으로 가는 과정은 나중에 설명하겠습니다. 다음 조절효과 주제는 조절변수가 이진 더미변수가 아니라 3개 이상의 범주를 가지는 경우에 대해 조금 자세히 설명하겠습니다. 종교 같은 변수를 유종교 와 무교로 이진 변수로 만들 수 있지만 기독교, 불교, 무교로 3개의 범주의 변수로 만들 수도 있습니다. 이 경우 조절변수를 어떻게 처리하는 가에 대해서 다음에 설명하겠습니다. 

 

 

 

1. 기본 수학 모형

 

 

종속변수를 Y, 독립변수를 X, 조절변수를 M(moderator)이라고 하죠.

 

 

그럼 조절효과를 보는 수식은 다음과 같습니다.

 

 

Y=b0+b1X+b2M+b3(X*M)

 

이렇게 됩니다. 여기서 b2는 조절변수의 주효과(main effect)를 보는 회귀계수이고, b3가 조절효과, 상호작용효과(interaction effect)를 보는 회귀계수입니다.

 

 

여기서

 

1) 통상 XM은 원 데이터셑에 들어있는 변수입니다. 그러나 (M*X)는 여러분이 두 변수를 곱하기 해서 새로 만들어야 하는 변수입니다.

 

 

2) 위에서는 독립변수나 조절변수가 오직 1개인 것처럼 썼지만 실제로 여러개의 변수일 수 있습니다. 그럼 위 식은 다음과 같이 변합니다.

 

 

독립변수가 여러개 일 때:

 

Y=b0+(b11X1+b12X2+b13X3)+b2M+b31(X1*M)+b32(X2*M)+b33(X3*M)

 

 

조절변수가 여러개일 때:

 

Y=b0+b1X+b21M1+b22M2+b23M3+b31(X*M1)+b32(X*M2)+b33(X*M3)

 

 

독립변수도 조절변수도 모두 여러개일 때: 이 경우 식이 매우 복잡해집니다.

 

Y=b0+b11X1+b12X2+b13X3)+b21M1+b22M2+b23M3+b311(X1*M1)+b312(X1*M2)+b313(X1*M3)+b321(X2*M1)+b322(X2*M2)+b323(X2*M3)+...

 

이렇게 식이 매우 복잡해지는데 현실 분석에서는 어떻게 하는 것이 정답일까요?

 

원칙적으로는 복잡한 형태 그대로 해야 합니다. 왜냐하면 이 독립변수와 조절변수는 서로 독립적으로 작용하는 것이 아니라 동시에 서로 영향을 미치면서 작용하기 때문입니다.

 

예를 들어 부모의 양육태도가 청소년의 학업성취도에 미치는 영향에서 교우관계와 교사관계의 조절효과를 보고 싶다고 하죠.

 

부모양육태도에는 여러개의 변수가 있습니다. 또 조절변수로는 교유관계와 교사관계 2개의 조절변수로 설정하였고요. 그럼 이 변수들이 각각 다 따로 노는 변수들이 아니고 현실에서 서로 다 일정시점에서 같이 일어나는 현상들입니다. 그래서 통계모형에 다 포함을 시켜야 합니다. 또 이렇게 안하면 이론적으로 서로 모순되는 불일치한 결과를 얻는데 이런 복잡한 문제는 이야기 안하겠습니다.

 

 

하여간 현실 분석에서는 이렇게 하지를 않습니다. 통상 독립변수는 여러개 다 잡고, 조절변수는 각각 따로 분석을 합니다. ,

 

Y=b0+(b11X1+b12X2+b13X3)+b2M+b31(X1*M)+b32(X2*M)+b33(X3*M)

 

이 모형으로 하되 조절변수 각각에 대해서 한다는 것이죠.

 

 

 

2. 기본 수학모형의 이해나 해석

 

그래서 원래 기본 모형으로 돌아가서 한번 보죠. 이건 위의 독립변수가 여러개, 조절변수가 1개인 경우로 확장해서 이해하시면 됩니다. 기본 모형

 

Y=b0+b1X+b2M+b3(X*M)

 

여기서 이해를 위해 조절변수를 이진 더미변수로 바꾼다고 하죠. 그래서 조절변수 M을 평균 이하인 집단은 0, 평균 이상인 집단은 1로 코딩을 합니다.

 

만약 성별 같이 원래 이진 더미변수인 경우 남자=0, 여자=1로 다시 코딩을 하면 됩니다.

 

그럼 남자인 경우(M=0)는 위 식 M0을 대입하면

 

Y=b0+b1X

 

여자인 경우(M=1)는 위식에 M1을 대입하면

 

Y=(b0+b2)+(b1+b3)X

 

 

 

위 식을 하나로 표시하면

 

Y=(b0+c)+(b1+d)X

 

이렇게 표현할 수 있습니다. 그럼 남자인 경우 c=0, 여자인 경우 c=b2, 이렇게 되고 d는 남자인 경우 d=0, 여자인 경우 d=b3가 됩니다. 이게 혼합모형과 패널회귀분석의 기본적인 수학 모형입니다. cd에서 고정효과와 확률효과라는 말이 나옵니다.

 

 

 

그래서 b2는 조절변수의 주효과로서 독립변수 X의 값과 상관없이 전반적으로 종속변수를 올리거나 내리는 효과가 있는 것이고, b3는 여자인 경우, M=1로 코딩한 집단이 독립변수 X가 종속변수 Y에 미치는 영향력, 즉 기울기에서 남자집단(M=0)인 집단과 얼마나 차이가 있는지 보는 것입니다.

 

그럼 SPSS에서 실제 결과표를 한번 보죠.

 

통상 조절효과를 보라고 하면 한국에서는 단계별로 해서 1단계에 독립변수를 넣고, 2단계에서는 조절변수를 넣고 3단계에서는 앞에서 이야기한 독립변수와 조절변수를 곱하기 한 상호작용항을 넣고 돌립니다. 그리고 이것을 위계적 회귀분석을 하는 방법이라고 알려져 있는데요.

 

이건 틀린 이야기입니다. 이렇게 단계적으로 투입하는 것은 Nested Model인 경우 Model selection을 위해 SPSS에서 만들어진 메뉴입니다. 조절효과를 보려고 하는 작업이 아니고요. 더 이상 이야기하면 복잡해지니까 그냥 넘어가고요.

 

하여간 3단계만 보면 됩니다. 거기서 상호작용항에서 유의적으로 나오면 조절효과가 유의적으로 나왔다고 하고 해석을 잘 하면 됩니다.

 

독립변수를 리더십으로 하죠. 조절변수는 구단의 지원으로 하죠. 리더십은 다양한 형태가 있습니다. 거래적 리더십, 변혁적 리더십, 서번트 리더십, 임파워링 리더십 등 다양하게 있습니다. 현실에서는 여러 가지 리더십이 혼재되어 나타나는 것이죠. 단지 특정 리더에서는 위 4가지 리더십 중 어떤 리더십이 강하게 나타나고 어떤 리더십이 약하게 나타나고 그런 것이죠.

 

거래적 리더십은 한마디로 이야기하면 당근과 채찍, 또는 신상필벌 이런 말로 바꿀 수 있습니다. 지금 토트넘의 무리뉴는 이 리더십의 가장 안 좋은 형태이죠. 변혁적 리더십은 리더의 비젼 제시를 중요하게 여깁니다.

 

이에 반해 서번트 리더십은 문재인이 대표적이라 할 수 있는데 부하들을 섬기는 리더십이죠. 너무 잘해주니까 지금 밑에 있는 얘들이 개기고 있는 것이죠.

 

임파워링 리더십은 부하의 자율적 행동을 중시하는 리더십입니다. 대표적으로 노무현이가 이걸 시도하려고 했는데 이게 실패한 것이죠.

 

서번트나 임파워링 리더십이 나쁜 것이 아니라 지금 한국 사회에서는 안 맞는 것입니다. 상황에 맞춰 적절하게 구사해야 하는데 노무현이나 문재인이 서번트 리더십이나 임파워링 리더십에 너무 몰입을 해서 지금 개판이 되어 버린 것이죠.

 

 

구단의 지원은 지원이 약한 구단은 0, 지원가 강한 구단은 1로 합니다.

 

종속변수는 EPL 팀의 점수를 하면 되겠죠.

 

그럼 각 구단에 속한 선수들에게 감독의 리더십과 구단의 지원에 대해 평점을 매기게 합니다. 구단의 지원은 조절변수이니까 전체 평균을 구해 이 평균보다 낮은 경우는 0. 높은 경우는 1로 이진 더미변수를 새로 만듭니다. 그리고 리더십과 곱하기 한 상호작용항을 새로 만든다는 것이죠. 이걸 SPSS에서 돌리면 다음과 같은 형태의 결과를 얻을 수 있습니다.

 

 

독립변수

비표준

표준

회귀계수

t

p

회귀계수

표준오차

상수(b0)

 

 

 

 

 

거래적(b11)

 

 

 

 

 

변혁적(b12)

 

 

 

 

 

서번트(b13)

 

 

 

 

 

임파워(b14)

 

 

 

 

 

구단지원(b2)

 

 

 

 

 

거래*구단(b31)

 

 

 

 

 

변혁*구단(b32)

 

 

 

 

 

서번트*구단(b33)

 

 

 

 

 

임파워*구단(b34)

 

 

 

 

 

 

 

거래서 위에 빨간게 칠한 부분이 조절변수 M=0인 경우, 즉 구단 지원이 낮은 구단의 감독 리더십과 팀의 성적간의 관계이고

 

위의 빨간 색 칠한 부분에서 아래 파란색 칠한 부분을 더하면 조절변수 M=1인 경우, 즉 구단의 지원이 높은 구단의 감독과 팀의 성적간의 관계가 되는 것입니다.

 

즉 구단의 지원이 높은 팀의 상수, Y 절편은 (b0+b2)가 되고 거래적 리더십이 팀의 성적에 미치는 영향, 즉 기울기는 구단의 지원이 낮은 집단은 b11, 구단이 지원이 높은 팀은 (b11+b31) 됩니다.

 

조절효과는 본다는 것은 b31, b32, b33, b34가 유의적인지 아닌지, 즉 진짜는 회귀계수가 0인지 0이 아닌지를 본다는 것입니다.