실험효과분석

일반선형모형의 응용:실험효과검증(공변량분석과 이원분산분석)

학위논문통계 2024. 6. 23. 17:04

 

이번에는 지난번에 소개한 일반선형모형을 이용하여 실험효과를 검증하는 공변량분석을 해 보겠습니다.

 

실험의 계획은 대강 이렇습니다.

 

제약회사에서 새 다이어트 약을 개발했습니다. 그래서 이 약이 실제로 체중감소에 도움이 되는지 검증을 하고자 합니다.

 

먼저 2개의 집단을 뽑습니다.

 

하나는 실험집단으로 실험기간동안 다이어트 약을 투입할 집단입니다.

 

하나는 통제집단으로 실험기간동안 아무것도 하지 않을 집단입니다.

 

왜 이렇게 복잡하게 2개의 집단을 만들어서 실험을 할까요.

 

만약 일반인이 생각하듯 어떤 집단에 다이어트 약을 처방한 뒤 처방 전과 처방 후에 몸무게를 재면 어떤 문제가 생길까요.

 

만약 우리가 체중 감소를 위해 다이어트 약을 먹기로 결심한다면 단순히 다이어트 약만 먹지를 않습니다. 어떤 사람은 운동도 같이 하기도 하고, 어떤 사람은 식단도 전보다 더 조심하게 됩니다. 또 어떤 사람은 안 좋은 일이 있어 폭식을 할 수 있습니다.

 

그럼 나중에 체중 감소의 효과는 순수하게 다이어트 약에 따른 효과인지, 운동의 효과인지, 아니면 식단의 효과인지 알 수가 없다는 것이죠. 아니면 폭식 때문에 다이어트 약의 효과가 나타나지 않을 수도 있습니다.

 

그래서 집단을 2개로 만들어 실험을 하는 동안 그 기간에 두 집단이 가능하면 같은 일을 겪도록 하게 하는 것입니다. 그럼 2 집단에서 차이가 난다면 다이어트 약을 처방한 효과만이 실험집단에서 나타나도록 하는 것입니다.

 

 

또 하나의 중요한 것은 확률화(randomization)이라는 것인데 이건 두 집단에 참가하는 실험대상자가 한쪽에 치우지지 말고 다양해야 한다는 의미입니다.

 

실험을 주도하는 사람이면 자기 욕심에 실험집단에 일부러 살이 찐 사람을 많이 배당할 수 있을 겁니다. 아니면 우연히 통제집단에 여성들이 훨씬 더 많이 배당받을 수 있을 겁니다. 이런 경우 모두 확률화가 제대로 안된 경우입니다.

 

 

그래서 옛날 실험효과을 검증할 때 처음에 하는 작업이 실험 전에 두 집단에서 측정한 몸무게가 통계적으로 동일한 지 검증하는 작업입니다.

 

그래서 두 집단의 사전 동질성 검사를 한 다음 이 동질성 검사가 통과되면 실험 후 두 집단간에 차이가 있는지 다시 검증합니다.

 

지금은 사전에서 차이가 있더라도 이 차이를 통계적으로 고려할 수 있는 공변량 분석이나 이원분산분석을 합니다.

 

 

그럼 2 두가지 방법인 공변량 분석과 이원분산분석을 일반선형모형 메뉴를 이용해서 해 볼까요.

 

 

일단 데이터 모양이 다릅니다.

 

-공변량 분석

 

집단 사전점수 사후점수
0 45.23 47.48
0 57.74 54.37
0 87.38 84.23
0 77.48 75.25
0

0

1 74.47 71.92
1 65.35 60.23
1 58.28 51.35
1 77.28 68.19
1

 

 

그럼 일반선형모형 메뉴에 가서

 

종속변수는 사후점수, 집단을 하나의 범주형 고정효과 변수로 잡고 사전점수를 공변량으로 잡으시면 됩니다. 그리고 메뉴에 가서 집단의 주성분, 사전점수의 주성분을 하시면 돕니다.

 

그리고 결과에서 집단에서 유의적인 차이가 있으면 됩니다.

 

 

-이원분산분석 데이터

집단 사전사후 사전점수
0 0 45.23
0 0 57.74
0 0 87.38
0 0 77.48
0 1 47.48
0 1 54.37
0 1 84.23
0 1 75.25
0

0

1 0 74.47
1 0 65.35
1 0 58.28
1 0 77.28
1 1 71.92
1 1 60.23
1 1 51.35
1 1 68.19
1

 

 

종속변수는 몸무게이고 메뉴에 가서 집단과 사전사후 이 2개의 고정요인을 선택한 다음 디폴트인 완전요인모형을 그대로 선택하신 다음 분산분석표에서 상호작용항이 유의적으로 나오면 됩니다.