실험계획/이원분산분석

이원분산분석:실험효과검증

학위논문통계 2022. 10. 30. 12:31

이번은 이원분산을 이용해서 사전-사후, 실험-통제집단의 실험효과를 검증하는 방법을 설명하겠습니다.

 

이 경우는 데이터는 공변량 분석과 다르게 하나의 변수로 처리해야 합니다.

 

 

, 공변량 분석에서는

 

집단 사전측정값 사후측정값  
0 3.5 3.7  
0 3.25 3.19  
1 2.85 3.25  
1 3.41 3.54  

 

0은 통제집단, 1은 실험집단이고요.

 

그러나 이원분산분석에서는 시차 변수를 추가하고 측정변수는 하나로 만들어야 합니다.

 

집단 시차 측정값  
0 0 3.7  
0 0 3.19  
0 1 3.7  
0 1 3.19  
1 0 2.85  
1 0 3.41  
1 1 3.25  
1 1 3.54  
       

 

이원분산분석 식을 쓰면

 

Y=u+a+b+a*b+e

 

이렇게 됩니다. 원래 ab는 그리스 문자로 쓰는 것이 관례인데 여기 네이버 블로그에서는 수식편집기가 있어 그리스 문자 쓰는 것이 편합니다. 그런데 제가 다음 불로그인 tistory에도 같이 올리기 때문에 거기서는 수식편집기를 제공하지 않거든요. 수식을 이미지로 만들어 그림으로 첨가해야 합니다.

 

다음 티스토리 블로그 주소는 dataminer9.tistory.com입니다. 여기서 꽤 많은 글을 올렸는데 너무 전문적인 내용이 많아 거기의 일부 내용만 여기 네이버로 이전하고 나중에 시간나면 더 쉽게 수정하려고 합니다.

 

네이버 수식편집기나 한글 수식편집기나 이건 세계 공통인 Tex 명령어입니다. 수식편집기 윗 창에서 수식을 넣으면 아래 창에서 이상한 명령어가 보입니다. 이게 Tex 명령어입니다. 수학기호를 많이 쓰는 학과는 이 Tex를 사용하여 논문을 쓰고 수학책도 Tex으로 쓰진 책들이 많이 있습니다. 지금은 잘 모르겠네요.

 

이게 프로그램 언어는 아니고 문서편집 언어라고 해야 하나 그런 종류입니다. 옛날 애플의 맥을 써서 문자편집한 사람은 Adobepostscript 이라는 것을 아실겁니다. psTex 같은 명령어로 되어 있습니다. 이걸 프린터에서 보려면 ps을 지원하는 좀 비싼 프린터를 사야합니다. 그런데 마소가 true font를 개발하는 바람에 차별성이 없어져서 ps은 시장에서 사라졌죠. 그 대신 Adobepdf를 개발한 것이고요. “distribute globally, print locally"pdf의 철학입니다.

 

 

 

1. 상호작용효과(interactive effect)

 

하여간 잡설은 그만하고 다시 수식으로 넘어가죠.

 

Y=u+a+b+a*b+e

 

여기서 Y는 측정값, u는 전체 평균, a는 집단효과, b는 시차효과(사전, 사후), a*b는 집단과 시차의 상호작용효과, 그리고 e는 오차입니다.

 

여기서 우리가 봐야 하는 것은 a, b가 아니라 a*b 즉 상호작용효과입니다. 이 효과가 유의적으로 나오면(p<.05) 실험의 효과가 있다는 것이 검증된 것입니다. 앞에서 공변량 분석에서도 이야기했지만 이 효과가 있다는 것만 검증된 것이지 이 효과가 긍정적인 효과인지 아니면 부정적인 효과인지는 여전히 모르는 것입니다. 이걸 알려면 실험-통제, 사전-사후 각각의 경우 평균을 구해 알아봐야 합니다.

위 그림에서 보듯이 상호작용효과가 유의한 경우는 두 집단의 기울기가 완전하게 다른 경우입니다. 이건 세 집단 이상의 경우나 아니면 사전, 사후, 추후 등 시차가 3번 이상인 경우에도 해당됩니다.

 

공변량 분석에서와 마찬가지로 여기서 집단*시차 상호작용항이 유의적으로 나왔다고 해서 우리가 원하는 실험의 효과가 있다는 이야기는 아닙니다. 실험의 효과가 긍정적인지 아니면 반대로 부정적인 효과인지는 사전-사후, 실험집단-통제집단의 평균값을 비교해야 합니다.

 

 

2. 주효과(main effect)

 

그럼 a*b(집단*시차) 상호작용효과가 유의적인 경우를 봤는데 그럼 a(집단)b(시차) 항은 무슨 의미가 있는 것일까요. 여기서 ab의 효과를 주효과(main effect)이라 합니다.

 

1) a(집단의 효과)

 

이것은 실험집단 측정값(실험집단 사전 점수 + 실험집단 사후 점수)

통제집단 측정값(통제집단 사전 점수 + 통제집단 사후 점수)

 

이 두 값이 유의적인 차이가 있는지 보는 것입니다. 차이가 나기가 쉽지 않죠. 왜냐하면 실험집단과 통제집단이 사전 점수이 비슷하게 나오기 때문입니다.

 

2) b(시차의 효과)

 

이것은 사전 측정값(실험집단 사전 점수 + 통제집단 사전 점수)

사후 측정값(실험집단 사후 점수 + 통제집단 사후 점수)

 

이 두 값이 유의적인 차이가 있는지 보는 것입니다. 이것도 차이가 나기가 쉽지 않죠. 왜냐하면 통제집단이 사전, 사후 점수가 비슷하게 나오기 때문입니다.

 

 

3. spss에서 실제 작업 예

 

 

그럼 SPSS에서 어떻게 하는지 한번 볼까요.

 

일반선형모형==> univariates에 가서

 

고정요인에 집단과 시차를 넣으면 됩니다. 통상 아래 랜덤요인과 공변량은 넣을 필요가 없지만 상황에 따라서 넣을 수도 있습니다(공변량:실험효과 글 참조)

그 다음 공변량 분석과 마찬가지로 options에서 기술통계(descriptive statistics)와 모수 추정(parameter estimates)에 체크하면 기술통계와 회귀분석 결과물을 얻을 수 있습니다.

 

 

아래는 그 결과물입니다.

결과에서 보면 집단*시차 상호작용항이 F=0.141, p=0.710으로 p 값이 0.05보다 훨씬 크기 때문에 다이어트가 신체증상에 전혀 영향을 없다는 것을 알 수 있습니다. 이 결과는 회귀분석 결과에서도 상호작용항에서 p=0.710으로 같음을 알 수 있습니다. t2=F에서 t0.376을 제곱하면 분산분석표에서 F=0.141이 되는 것을 알 수 있습니다.

 

만약 상호작용항이 유의적이라면 위의 기술통계 평균값을 논문에 적시하고 실험집단별, 통제집단별 사전, 사후 평균의 변화 plot을 그려주면 됩니다.

 

plotplots 체크한 다음, 다음 그림과 같이 수평축과 분리선을 지정하고 아래 add를 체크하시면 됩니다.

저는 spss plot이 별로 예쁘지 않기 때문에 R에서 프로그램해서 plot을 그립니다.