2022/10/14 2

통제변인, 공변인, 공변량분석2

1. 통제변수 추가 회귀분석을 할 때 독립변수 X가 유의적인 영향력이 나와야 하는데 아깝게 p=0.065로 유의수준 0.05에서 유의하지 않았다고 해보죠. 이럴 경우 인구통계 변인을 통제변수로 넣으면 종종 독립변수 X가 유의적으로 나올 수 있습니다. 교묘하게 조작을 하는 것이죠. 이 경우 원래 통제변수의 정의에 따라 인구통계 변인 중 종속변수 Y와의 관계가 깊은 변수를 넣어야 합니다. 즉 상관계수 분석이나 분산분석 결과를 보고 종속변수 Y와 밀접한 관계가 있는 인구통계 변인을 통제변수로 넣어야 하는 것이 원칙입니다. 그러나 이렇게 원칙적으로 넣으면 오히려 결과가 더 안좋게 나오는 경우가 많습니다. 즉 독립변수 X의 p 값이 더 커지는 경우가 많습니다. 그러나 종속변수 Y와 전혀 상관이 없는 인구통계 변인..

통제변인, 공변인, 공변량분석1

오늘은 논문에 자주 나오지만 정확하게 정의되어 있지 않는 통제변수와 공변인(covariates)에 대해서 설명을 해보죠. 통계학 책에서 이 용어들이 정확하게 정의되어 있지 않는 이유는 회귀분석에서는 이 변인들이 전부 다 독립변수라는 용어를 사용하기 때문입니다. 즉, 개념상 통제변수와 공변인의 용어를 사용할 수 있지만 실제 이론상 회귀분석의 독립변수와 똑같은 역할을 하기 때문입니다. 따라서 회귀분석 이론상 전혀 구별할 이유가 없습니다. 그럼 통제변수와 공변인은 언제 사용하는가? 먼저 간단한 예를 들어 보죠. 운동을 하면 살이 빠지는가 이런 문제에 관심을 가지고 있다고 하죠. 그럼 헬스장에서 운동을 하는 사람들의 운동기간과 그 동안의 체중감소를 측정합니다. 운동기간은 독립변수 X, 운동기간 동안 감소된 체중..