비모수통계이해/비모수통계이해

Mann-whitney와 Wilcoxon Matched Paireds Signed Rank

학위논문통계 2017. 1. 28. 10:53

 

 

오늘은 Mann-Whitney U test와 Wilcoxon Matched Pairs Signed Rank Test에 대해서 간단히 설명하고, Kruskal-Wallis ANOVA는 생략하겠습니다. 이건 잘 안나오는 분석이라서요.

 

 

 

1. Mann-Whitney U test

 

MH U 검증은 실험에서 사전 동질성 검사를 하거나 사전 동질성 검사가 통과된 후 사후에서 실험군과 대조군에서 유의적인 차이가 있는지 검증, 즉 실험의 효과가 있는지 검증할 때 사용합니다.

 

MH U 검증에서 실제로 구하는 것은 간단합니다. 두 집단의 값을 하나로 모아 순서대로 놓은 다음 순위(rank)를 구하고 한 집단에서만의 순위 합만 구하면 됩니다.

 

즉 T=sum(집단 A의 순위) 이걸 구하면 됩니다. 실험군이 2명, 대조군이 3명이라 하고 다음의 표처럼 우울의 값이 나왔다고 하죠.

 

 

실험군

대조군

전체 순서 데이타

순위

T=sum(실험군 순위)

3.24

3.75

1.89

1

5

2.57

4.10

2.57

2

1.89

3.24

3

3.75

4

4.10

5

 

세 번째 칸은 두 집단의 값을 하나로 뭉쳐서 순서대로 쓴 것입니다. 이에 따라 다음의 칸에서 순위를 매긴 것이고요. 그래서 전체에서 실험군의 우울의 값은 2위와 3위를 했습니다. 최종적으로 구하는 T=2+3=5입니다. 이 값을 가지고 검증을 하는 것입니다.

 

 

그럼 이런 의심을 할 수 있습니다. 실험군의 사람의 수가 많아지면 어떻게 됩니까 이렇게 의심을 할 수 있다는 것이죠. 걱정할 필요가 없습니다. 비모수 통계 책 뒤에 실험군의 사람 수 n과 대조군의 사람 수 m에 따라 어떻게 검증할 지 확률 값이 나옵니다. 기초 통계학 뒤에 보면 각 분포의 확률값에 대한 표들이 나오죠. 우리의 경우 n=2, m=3이고 T=5 이니까 이 정보를 가지고 전문용어로 기각 확률이 어떻게 되는지 찾아보면 됩니다. 물론 통계 프로그램에서는 프로그램 내부에 이 표 값이 저장되어 있어 자동적으로 결과물에 제시해 주겠죠.

 

그래서 유의수준을 0.05로 했다면 n=2, m=3, T=5에 해당하는 기각확률(SPSS에서는 유의확률이라고 부르는 값)이 0.05보다 크면 두 집단 실험군과 대조군이 우울에 관해서 동질적인 집단이라 판단하고 0.05보다 작으면 실험군과 대조군이 우울에 관해 통계적으로 유의적인 차이가 있는 집단이라 판단을 합니다.

 

 

 

일단 주어진 유의수준에서 사전 조사에서 두 집단이 동질적으로 나오면 사후에서도 실험군과 대조군이 동질적인지, 차이가 있는지 다시 한번 MH U 검증을 한다는 것이죠.

 

사전과 사후 사이에 실험집단은 우리가 어떤 treatment, 또는 program(예를 들어 특정 다이어트 방식, 운동방식) 적용하였고, 대조군은 아무 것도 하지 않았기 때문에 사후에는 실험군과 대조군 MH U 검증에서 유의적인 차이가 나야 합니다.

 

 

 

2. Wilcoxon Matched Pairs Signed Rank Test

 

이름은 조금 복잡한 것 같지만 앞에서 설명한 Wilcoxon Signed Rank Test와 기본적인 개념은 같습니다.

 

 

이 검증은 실험군 대조군 두 집단을 비교하는 것이 아니라 특정 집단, 즉 실험군이나 대조군 중 하나의 집단에서 사전-사후를 비교합니다.

 

 

앞에서 두 집단이 사전에 동질적이지 않다고 나오면 사후의 실험군, 대조군에 대해 MH U 검증을 할 수 없습니다.

이건 100m 달리기랑 똑 같은 개념입니다. 두 사람이 100m 달리기를 하는데 A라는 사람이 출발점에서 B라는 사람보다 앞서 있다면 나중에 100m 결승에서 A와 B 중 누가 빠르지 검사를 해봐야 소용이 없다는 것이죠. 애초에 출발하는 시점에서 A가 앞서 있었으니까요.

 

또 금수저 흙수저 개념이라 비슷합니다. 한 사람은 금수저이고 한사람은 흙수저 이면 나이 30에 금수저 사람이 흙수저 사람보다 출생했다고 해서 금수저 사람이 더 노력을 했다든지, 아니면 더 재능이 많다고 결론을 내릴 수가 없다는 이야기이죠.

 

 

그래서 실험의 효과가 있다고 판단하려면 일단 실험군에 대해서는 사전-사후간의 유의적인 차이가 있어야 합니다. 우울이면 사후에 사전보다 유의적으로 떨어져야 하고 삶의 질이면 사후에 유의적으로 올라야 합니다. 또 대조군은 treatment나 program이 개입이 되지 않았기 때문에 사전-사후간에 유의적인 차이가 없어야 합니다. 또는 대조군에서도 유의적인 차이가 있다고 해도 실험군에서 변화가 훨씬 더 크면 실험의 효과가 있다고 할 수 있지만 어느 정도 실험군의 변화가 더 커야 하는지 이론적으로 검증할 수 없는 단점이 있습니다.

 

 

하여간 이건 사전-사후 같이 짝 개념이 있는 경우는 연구 대상의 id을 사전, 사후에 바르게 추적을 해야 합니다. 사전과 사후에 순서가 뒤죽박죽 되면 안됩니다.

 

아래 표를 보죠. 실험집단이라 하죠.

 

 

이름(id)

사전 우울

사후 우울

부호

|D|

|D| 순위

김개똥

3.5

3.0

-

0.5

3

안영순

2.5

2.55

+

0.05

4

최철수

4.0

3.0

-

1.0

1

이호영

3.5

2.75

-

0.75

2

 

 

1) 첫줄은 김개똥이라는 사람의 사전, 사후 우울 점수입니다. 이렇게 똑같은 사람의 사전 사후 데이터가 짝으로 나와야 합니다. 이건 모수통계 방법인 공변량 분석을 할 때도 마찬가지입니다. 그래서 처음 실험 준비할 때부터 사람의 id를 잘 추적해야 하고 의뢰를 할 때 데이터 보낼때도 사람 순이 맞아야 합니다.

 

 

2) 방법은 Wilcoxon Signed Rank 검증이랑 똑같습니다. 단지 사전-사후를 하거나 사후-사전 빼기를 한 사전, 사후 차이 데이터를 가지고 계산을 한다는 차이 밖에 없습니다. 그래서 사전 사후 차이 D를 구한 뒤 이 차이의 절대값 |D|를 구하고 순위를 매깁니다. 그런 다음 차이가 음수인 경우, 또는 양수인 경우의 순위의 합을 매깁니다. 음수를 해도 되고 양수를 해도 됩니다. 아마 SPSS에서는 음수, 양수 순위 합을 다 구해줄 겁니다.

 

 

3) 우리의 경우 사후-사전을 하고 그 부호를 저장했습니다. 그래서 사후에 사전에 비해 우울 값이 떨어진 경우가 4명 중 3명이 나오고 우울 값이 올라간 경우가 1명 나왔습니다. 그래서 음수가 나온 사람들의 순위 3, 1, 2의 합인 T=3+1+2=6가 나왔습니다.

 

 

4) 만약 실험이 효과가 매우 좋았다면 실험 대상자 모두 양수가 되거나 음수가 될 겁니다. 우울의 경우 거의 모든 경우 음수가 될 것이고, 삶의 질의 경우 대부분의 사람이 양수가 될 것입니다. 그래서 순위 합이 4명인 경우 T=1+2+3+4=10이 될 겁니다.

 

만약 실험군에서 실험의 효과가 없다면 또는 대조군의 경우 처럼 실험을 하지 않았으면 사후-사전의 부호가 서로 비슷비슷한 수준으로 나올 겁니다. 그리고 그 절대값인 |D|의 값도 서로 비슷비슷해서 순위가 랜덤하게 배치될 겁니다. 따라서 이런 실험의 효과가 없거나 대조군의 경우 T=(1+2+3+4)/2의 값에 가깝게 될 겁니다.

즉 사전, 사후에서 차이가 있다면 (전체 순위의 합)에 가깝게 나오고 사전, 사후 차이가 없다면 (전체 순위의 합/2)에 가까운 값이 나올 겁니다.

 

 

5) 이 방법에는 약점이 있습니다. 만약 사후에 우울이 모두 떨어졌다고 하죠. 그러나 한 경우는 약간씩 떨어지고, 즉 0.1정도 떨어지고, 한 경우는 매우 크게 떨어졌다고, 즉 1.0 정도 떨어졌다고 하죠. 그럼 후자의 경우가 전자의 경우보다 우울에 대한 실험의 효과가 매우 컸다고 판단할 수 있습니다. 그러나 이 방법은 순위만 계산했기 때문에 두 경우다 순위의 합은 똑같은 값이 나옵니다. 그래서 실험의 효과의 정도에 대한 정확한 평가를 하기 힘든 단점이 있습니다.

'비모수통계이해 > 비모수통계이해' 카테고리의 다른 글

비모수통계2  (0) 2017.01.20
비모수통계 소개1  (0) 2017.01.17