Baron & Kenny 매개,조절효과/조절효과

조절효과2

학위논문통계 2013. 5. 16. 23:55

 

조절효과를 더 써보죠. 지난번 말썽 많았던 알통과 보수 논문을 다시 생각해보죠.

 

알통논문의 주장은 다음과 같습니다.

 

 

 

 

 

 

 

알통이 소득재분배 정책에 영향을 미치는 관계에서 소득수준이 조절변수의 역할을 한다는 것이죠. 전체적으로, 또는 중간소득 계층에서는 알통 굵기가 소득재분재 지지에 미치는 영향력이 없지만 고소득에서는 -효과, 저소득에서는 +효과, 즉 고소득층에서는 알통 굵기가 굵을수록 소득재분배 정책을 더 반대하고, 저소득층에서는 알통굵기가 굵을수록 소득재분배 정책을 더 찬성한다는 것이죠. 전체적으로는 상쇄되어 알통굵기가 소득재분배 정책에 영향력이 없는 것으로 되는 것이죠.

 

사실 이런 경우는 그렇게 많지는 않는데, 그런 측면에서 보면 매우 의미있다고 볼 수 있지만 논리적으로 심각한 문제가 있는 논문이죠.

 

저소득층에서도 육체노동을 심하게 하는 사람은(그래서 알통굵기가 굵은 사람은) 소득재분배를 강력하게 요구할 수 있고, 고소득층에서는 돈이 많을수록 소득재분배를 반대하는데 이 사람들이 자기관리을 잘해 알통굴기기가 굵을 수가 있다.

 

그래서 제가 얼굴이 예쁘면 더 보수적이라고 비꼬았는데요, 얼마전 일 때문에 데이터를 하나 얻었는데 이 데이터에서도 실제로 그렇게 나타나네요. 비만도가 낮을수록 고급음악이나 미술 관람등을 더 많이 하는 것으로 나오네요. 비만도와 다른 사회경제적 변수와 유의성이 매우 높게 나옵니다. 서울시 자료입니다.

 

아래 그림을 보시면 이 현상이 뭔지 쉽게 이해가 되실겁니다.

 

 

 

위 그림에서 보는 것처럼 비만도와 고급문화향수, 또는 알통과 소득재분배지지와의 관계를 유사 또는 허위적(spurious) 관계라고 합니다.

 

이 관계의 유명한 예가 Yule이라는 사람이 발견한 random walk 현상입니다. 계량경제학 책에 보면 다 있습니다.

 

두 개의 전혀 관계없는, 독립적인 random walk 데이터를 생성하고 이 두 개의 변수간의 관계를 알기 위해 회귀분석을 돌렸는데 매우 유의적인 관계가 있는 것으로 나왔습니다. 전혀 관계가 없어야 하거든요.

 

random walk이라는 이런 것입니다. 술 취한 사람을 적도에 세워 놓고, 북쪽으로 한 발자국 가면 1을 더해주고, 남쪽으로 한 발자국 가면 -1을 더해서 그 위치를 기록하는 것입니다. 여러분이 일정액을 걸고 노름하는 것이랑 똑 같은 모형입니다. 하여간 시간이 무한대로 가면 이 사람은 필연적으로 북극이나 아니면 남극으로 가게 됩니다. 상쇄되어 적도에 머물러 있는 것이 아니고요.

 

그래서 술 취한 두 사람을 적도에 세워 놓고, 걷게 한 거죠. 그럼 이 두 사람의 위치는 아무런 관계가 없어야 하거든요. 그런데 두 사람의 위치가 상당한 관계가 있는 것처럼 나왔다는 것이죠. 그래서 이 사람의 주장은 비정상시계열의 경우 조심해서 분석해야 한다는 이야기입니다.

 

그럼 본래의 위치로 돌아와서요. 스트레스가 이직의도에 영향을 미치는데 여기서 남녀간의 그 영향력이 차이가 있는지, 스트레스와 이직의도간에 성별의 조절효과가 있는지 보고 싶다는 것이죠.

 

그럼 데이터는 이런 형태로 되어야 합니다.

 

id

성별

스트레스

이직의도

성별*스트레스

1

0

3.24

2.98

0

2

1

2.78

3.25

2.78

3

0

3.54

2.97

0

4

0

2.67

2.45

0

5

1

2.87

2.87

2.87

 

 

 

 

 

 

 

원래 설문지를 코딩하면 이직의도까지만 되어 있습니다. 여기서 먼저 성별에서 남자는 0, 여자는 1로 변환합니다. 대부분 코딩은 남자는 1, 여자는 2로 코딩되어 있습니다. 이 경우는 변환하는 것이 좋습니다. 그리고 성별과 스트레스 값을 곱해 새로운 변수로 만듭니다. 이건 SPSS에서 데이터 변환 메뉴에서 해도 되고, 스크립을 짜서 해도 됩니다.

 

그 다음 이직의도를 종속변수로 하고, 스트레스, 성별, 성별*스트레스를 독립변수로 하여 회귀분석을 돌리면 됩니다. 이 경우는 이렇게 해도 되는데 만약 교호항(상호작용항)이 많으면 예를 들어 스트레스 하위변인 3개가 있다고 하면, 스트레스 하위영역 변인 3개, 성별을 1단계로 하고 2단계에서는 스트레스 하위변인 3개와 성별을 곱한 상호작용항 3개를 2단계 블록에서 추가로 독립변수로 넣으면 됩니다.

 

 

여기서 위계적 회귀분석(Hierarchical Regression Analysis) 이라는 말을 쓰는데 이걸 잘 못이해하고 있는 분들이 있습니다. 이건 고차원 독립변수가 들어가면 이 고차원 독립변수에 포함된 변수도 회귀분석 모형에 독립변수로 들어가야 하는 경우 위계적 회귀분석이라 합니다. 블록을 설정해서 위계적 회귀분석이라 부르는 것이 아니고요.

 

 

예를 들어 성별*스트레스라는 상호작용항이 독립변수로 들어가면 이 변수는 2차항입니다. 성별 1차, 스트레스 1차 그래서 2차항입니다. 그러면 여기에 포함된 성별, 스트레스도 꼭 독립변수에 들어가야 위계적 회귀분석이라 부릅니다. 따라서 다음의 모형은

 

 

이직의도=b0+b1성별+b2(성별*스트레스)

 

이직의도=b0+b1스트레스+b2(성별*스트레스)

 

 

 

이런 모형은 위계적 회귀분석이 아닙니다. 첫 번째는 스트레스가 독립변수에 들어가지 않았고요, 두 번째는 성별이 독립변수에 들어가지 않았습니다.

 

다음 시간에는 조금 이론적으로(사실 이론적도 아닙니다) 설명하겠습니다.