t검증,분산분석,F검증,ANOVA/t검증,분산분석,F검증,ANOVA

t 검증, 분산분석의 F 검증, 사후검증

학위논문통계 2013. 3. 14. 22:37

 

 

이번에는 성별, 학력 등 범주형 자료에 따라 연속형 변수가 차이가 있는지 검증하는 것을 보겠습니다. 통상 연속형 변수로는 자연과학에서 많이 나오는 변수나 교육학에서 많이 하는 시험점수, 또는 사회과학 논문에 많이 나오는 Likert형 변수들을 많이 사용합니다.

 

다음 예는 시골과 도시에 있는 학생들이 스트레스에 대해서 설문조사를 했다고 합시다. 데이터 형태는 다음과 같습니다. 아래 표 값은 완전히 엉터리입니다. 단지 개념을 설명하기 위해서 만든 것이라 생각하시면 됩니다.

 

 

1. 데이터 형태

 

id

성별

지역

경제수준

스트1

스트2

스트3

스트평균

1

1

2

3

3

2

2

7/3

2

2

2

1

4

5

4

13/3

3

2

1

2

3

2

3

8/3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

200

1

2

2

4

3

3

10/3

 

성별는 남자=1, 여자=2, 지역은 도시=1, 시골=2, 경제수준은 저소득=1, 중간=2, 고소득=3,

그리고 스트레스는 Likert 5점 척도로 문항수는 3개입니다. 그래서 마지막 칸에서 3 문항의 평균을 구합니다. 그래서 실제 분석에서는 스트1, 스트2, 스트3은 아무런 의미가 없고 마지막 칸에 있는 스트레스 평균값만 중요합니다.

 

 

2. 분석 결과 표

 

구분

분류

평균

표준편차

t/F 값

p 값

사후검증

성별

남자

3.12

0.21

0.973

0.587

.

여자

3.07

0.23

지역

도시

3.24

0.19

2.781

0.009**

.

시골

2.98

0.24

경제수준

3.21

0.23

4.231

0.038*

(c=b)<

(b=a)

3.07

0.19

2.99

0.20

전체

3.09

0.40

 

* p<.05, ** p<.01, *** p<.001

 

 

 

1. 먼저 앞의 통계분석 해석에서 이야기했듯이 p 값과 * 표를 보면 학생들의 지역별로, 경제수준별로 학생들 스트레스가 유의적인 차이가 있지만, 성별간에는 학생들의 스트레스에는 유의적인 차이가 없습니다. 그리고 지역의 *는 2개, 경제수준의 *는 1개로 지역별 학생들의 스트레스 차이가 경제수준별보다 더 뚜렷하게 나왔습니다.

 

2. 맨 마지막 전체는 성별, 지역, 경제수준별로 자세히 나누지 않고 전체 설문대상자를 대상으로 했을 경우 학생들 스트레스의 평균과 표준편차를 이야기 합니다. 이건 기본 분석에서 기술통계 표를 이미 제시 했다면 구태여 이걸 할 필요는 없습니다.

 

3. 여기서 보는 것은 기본적으로 평균값을 보는 것입니다. 집단간에 평균값에 차이가 있는 것을 보는 것인데 이것도 표준편차에 따라서 달라집니다. 단순하게 평균 차이가 크다고 해서 집단간에 차이가 있다고 이야기 할 수 없습니다. 앞에서도 이야기 했지만 척도에 따라 달라집니다. 예를 들어 똑같은 시험문제를 10점 만점으로 하는 경우와 100점 만점으로 하는 경우 남학생과 여학생의 평균 차이는 절대적 값으로 비교하면 10배 차이가 납니다. 똑 같은 현상을 분석하는 것이지만요.

 

4. 평균값을 해석하기 위해 척도값을 이해해야 합니다. 여기는 Likert 5점 척도로 측정한 것으로 가정한 것입니다. Liket 5점 척도는 전혀 그렇지 않다=1, 조금 그렇지 않다=2, 보통이다=3, 조금 그렇다=4, 매우 그렇다=5로 되어 있습니다. 그리고 점수가 높을수록 스트레스가 큰 것으로 해야 합니다. 그래야지 해석이 자연스럽습니다. 그래서 설문문항이 이런 식으로 되어야 합니다.

 

설문문항 예)

 

문항

전혀 그렇지 않다

조금 그렇지 않다

보통

이다

조금 그렇다

매우 그렇다

시험보기 전에 가슴이 심하게 두근거리다

 

 

 

 

 

 

 

만족도 같은 긍정적인 변수는 설문문항도 긍정적인 문항으로 물어봐야 합니다. 그래서 값이 높을수록 만족도가 높게 나오도록 해야 합니다. 그래서 나중에 표 해석에서 일반 생활에 사용하는 자연스런 해석이 나옵니다. 가끔 의도적으로 역문항, 부정문항을 몇 개 집어 넣는 경우가 있습니다. 이건 그냥 놔두야 합니다. 이건 설문대상자가 건성으로 응답하는 것을 막고, 만약 그런 경우가 생길 경우 이 설문지는 제거하기 위해 사용되는 것입니다.

 

하여간 이 스트레스는 최대 5점이고 값이 높을수록 스트레스가 큰 것으로 해석해야 합니다. 만약 평균값이 3.0이면 학생들 스트레스 정도가 평균이 ‘보통이다’ 정도이고 평균값이 4.0이면 ‘조금 그렇다’, 평균이 3.5이면 ‘보통이다’와 ‘조금 그렇다’의 중간 정도로 이해하시면 됩니다.

 

통상 만족도 같은 좋은 의미의 변수는 평균이 3.0보다 조금 높게 나오는 경향이 있고, 스트레스 같은 부정적인 변수는 3.0보다 조금 낮게 나오는 경향이 있습니다. 그래서 만족도가 3.5이상이면 그 집단의 만족도 수준이 상당히 높은 편이고 스트레스가 3.0이상이면 그 집단의 스트레스 수준이 상당히 높다고 봐야 합니다. 그러나 이건 일반적인 경향이고 연구 대상 집단에 따라서 많이 다르겠지요. 우리나라 교육 현실을 고려해 본 표에서는 학생들 평균 스트레스의 평균이 3.0 이상으로 했습니다.

 

5. 성별과 지역은 t 검증을 한 것이고 경제수준은 분산분석이 F 검증을 한 것입니다.

성별과 지역같이 두 개의 집단만 있는 경우 t 검증을 하고 경제수준 같이 집단이 세 개 이상인 경우 분산분석의 F 검증을 해야 합니다. 여기서 t 검증 값은 제곱하면 F 검증 값이 됩니다. 즉 t 검증이 F 검증의 특수한 경우라고 보면 됩니다.

 

t 검증 값은 +, - 값을 가질 수 있고, F 검증은 항상 + 값만 갖습니다. t 검증의 경우 기본적으로 (위의 집단 평균-아래 집단의 평균)을 가지고 하는 것이기 때문에 이 경우는 전부 + 값이 나왔습니다. 즉 남자, 도시의 학생들이 여자, 시골보다 평균값이 높게 나온 것이죠. 만약 코딩할 때 성별에서 여자=1, 남자=2, 지역에서 시골=1, 도시=2로 반대로 코딩했다면 t 값은 음수만 붙고 절대치 값이나 p 값에는 아무런 변동이 없습니다.

 

 

6. 사후검증

경제수준별로 보면 학생들이 스트레스 차이가 유의적으로 나옵니다. 그리고 이 경우에만 사후검증 결과가 있습니다. 이 사후검증을 이해하려면 분산분석의 F 검증을 이해해야 합니다.

분산분석의 F 검증은 경제수준별로 최소한 한 집단이 다른 집단과 차이가 있는지만 보는 것입니다. 어느 집단과 어느 집단간에 차이가 있는지에 대해서는 이야기를 하지 않습니다. 그래서 분산분석에서 F 검증을 해서 유의적인 차이가 났는데 그 다음 수순으로 어느 집단과 어느 집단간에 차이가 있는지 더 자세히 알아보는 것이 사후검증입니다.

 

그래서 표를 보면 사후검증의 결과를 보면 (c=b) < (b=a)라고 되어 있는데 이것의 해석은 다음과 같습니다. a,b,c 표시는 SPSS에서 사용하는 표시이고, 통계학에서의 관례는 아닙니다. 첫 번째 집단(경제수준 하)=a, 두 번째 집단(경제수준 중)=b, 세 번째 집단(경제수준 상)=c입니다.

 

그래서 결과를 보면 (경제수준 상=경제수준 중) < (경제수준 중=경제수준 하) 이렇게 됩니다. 즉 경제수준 상인 학생의 스트레스와 경제수준 중인 학생의 스트레스를 비교하면 유의적인 차이가 없고, 경제수준 중인 학생의 스트레스와 경제수준 하의 학생의 스트레스 차이는 유의적인 차이는 없습니다, 그렇지만 부등호 기호를 보면 경제수준 상인 학생보다 경제수준 하인 학생의 스트레스가 유의적인 차이로 크게 나왔습니다. 즉 경제수준 하인 학생은 경제수준 상인 학생과 비교하면 뚜렷하게 스트레스가 차이가 나지만 경제수준 중간인 학생은 박쥐처럼 다른 집단과 비교하면 뚜렷하게 차이가 없다는 것입니다.

 

실제로 사후검증을 해보면 분산분석이 F 검증을 한 경우 유의적인 차이가 없는데도 사후 검증에서는 차이가 있다고 나오는 경우가 있고, F 검증에서 유의적인 차이가 있는데 사후검증에서는 유의적인 차이가 없다고 나오는 경우가 자주 있습니다. 이건 동시 추론(simultaneous inference)의 문제로 피해갈 수 없는 문제입니다.

 

이런 것입니다.

 

Pr(소녀시대 미모는 차이가 있다)와

 

Pr(윤아와 유리의 미모는 차이가 있다, 그리고 유리와 소현의 미모는 차이가 있다, 서현과 제시카의 미모는 차이가 있다, 그리고,,,,,)

 

이 두 확률은 완전히 다릅니다.

 

“소녀시대 미모는 차이가 있다”는 “소녀시대 미모는 차이가 없다”의 반대인데 최소한 한 멤버가 다른 멤버보다 미모에서 차이만 있으면 되는 경우입니다. 이건 회귀분석에서 F 검증을 이해하는데도 중요합니다.

 

이런 예가 대선 후보 지지도 신뢰구간 구하는 경우에서도 나옵니다. 두 후보만 나오면 별 문제가 없습니다. 한 후보가 지지율이 p 라고 하면 다른 후보는 1-p로 바로 결정되어 문제가 없는데 세 후보 이상 나오는 경우 동시추론의 문제가 생깁니다. 그래서 여론조사 결과에 나오는 표본오차의 값은 정확한 값이 아닙니다. 표본오차라는 말도 틀린 용어같고요. 모르겠습니다. 이쪽 연구하는 학자들은 이 용어를 사용하는지 모르겠지만 신뢰구간에서는 정확하게는 신뢰구간과 신뢰수준의 용어만 사용합니다.

 

SPSS에서는 사후검증하는데 여러 가지 방법이 나옵니다. 흔히들 많이 쓰는 경우가 Scheffe입니다. 유명한 통계학자죠. 이렇게 여러 방법이 나온다는 것은 한 방법이 다른 방법보다 압도적으로 좋은 경우는 없다는 것이죠. 즉, 경우에 따라서 이 방법이 좋을수 있고, 다른 경우에는 다른 방법이 좋을 수 있고, 그렇다는 것이죠. 그래서 꼭 Scheffe를 쓸 이유는 없습니다.

 

사후검증 이론에 대해서는 저도 잘 모르고요. 석사때 잠깐 보고 그 이후로 한번도 보지를 않아서요. Scheffe의 ANOVA 책이나 Muller의 Simultaneous Inference 책에 아마 나올지 모르겠네요.==>Miller의 Simultaneous Statistical Inference 입니다. 이 사람이 쓴 Beyond ANOVA, Basics of Applied Statistics에는 사후검증에 대해서 간략하게 나와 있네요. 이책은 지금 가지고 있어서 확인해 보았습니다.

 

두 집단의 차이를 비교하는 t 검증에서는 왜 사후검증을 하지 않을가요? 이건 표에서 보면 당연하거든요. 일단 유의적인 차이가 있으면 두 집단의 평균 값을 보면 어느 집단이 어느 집단보다 스트레스 수준이 높은지 바로 알 수가 있거든요. 그래서 사후검증을 할 필요가 없습니다.

 

 

 

3. 스트레스 척도를 구하는데 꼭 설문문항을 평균해야 합니까?

 

이건 다음에 데이터 변형이나 신뢰도, 타당도 분석에서 설명하죠. 합을 사용할 수 있고, 요인분석해서 요인점수를 사용할 수 있습니다.