회귀분석 14

통제변인, 공변인, 공변량분석2

1. 통제변수 추가 회귀분석을 할 때 독립변수 X가 유의적인 영향력이 나와야 하는데 아깝게 p=0.065로 유의수준 0.05에서 유의하지 않았다고 해보죠. 이럴 경우 인구통계 변인을 통제변수로 넣으면 종종 독립변수 X가 유의적으로 나올 수 있습니다. 교묘하게 조작을 하는 것이죠. 이 경우 원래 통제변수의 정의에 따라 인구통계 변인 중 종속변수 Y와의 관계가 깊은 변수를 넣어야 합니다. 즉 상관계수 분석이나 분산분석 결과를 보고 종속변수 Y와 밀접한 관계가 있는 인구통계 변인을 통제변수로 넣어야 하는 것이 원칙입니다. 그러나 이렇게 원칙적으로 넣으면 오히려 결과가 더 안좋게 나오는 경우가 많습니다. 즉 독립변수 X의 p 값이 더 커지는 경우가 많습니다. 그러나 종속변수 Y와 전혀 상관이 없는 인구통계 변인..

통제변인, 공변인, 공변량분석1

오늘은 논문에 자주 나오지만 정확하게 정의되어 있지 않는 통제변수와 공변인(covariates)에 대해서 설명을 해보죠. 통계학 책에서 이 용어들이 정확하게 정의되어 있지 않는 이유는 회귀분석에서는 이 변인들이 전부 다 독립변수라는 용어를 사용하기 때문입니다. 즉, 개념상 통제변수와 공변인의 용어를 사용할 수 있지만 실제 이론상 회귀분석의 독립변수와 똑같은 역할을 하기 때문입니다. 따라서 회귀분석 이론상 전혀 구별할 이유가 없습니다. 그럼 통제변수와 공변인은 언제 사용하는가? 먼저 간단한 예를 들어 보죠. 운동을 하면 살이 빠지는가 이런 문제에 관심을 가지고 있다고 하죠. 그럼 헬스장에서 운동을 하는 사람들의 운동기간과 그 동안의 체중감소를 측정합니다. 운동기간은 독립변수 X, 운동기간 동안 감소된 체중..

회귀분석 문제점이나 질문 사안에 대한 답

일이 바빠 그 동안 글을 못썼는데요. 지금도 시간이 없어서 몇 분이 전화를 통해 질문한 것 간단하게 몇 개 쓰겠습니다. 1. 회귀분석에서 적합도인 결정계수 값이 너무 낮아요. 결정계수 R제곱이 너무 낮다는 이야기는 정확하게 이렇습니다. 어떤 경우에는 수정 결정계수가 음수로 나오는 경우도 있습니다. 연구모형에서 독립변수로 설정한 것 외에 종속변수 Y를 설명하는 요인 중에서 고려하지 않는 매우 중요한 요인이 있다는 이야기입니다. 하여간 지금 와서 새로운 독립변수를 더 추가해서 분석하는 것은 힘들죠. 다시 설문조사를 해야 하거든요. 그럼 이 경우 조금이라도 R제곱을 올리려면 통제변수를 추가하는 수 밖에 없습니다. 대표적으로 성별, 연령 등 순위형 인구통계 변수를 추가하는 것입니다. 통제변수는 이론적 배경에서 ..

회귀분석 해석 궁금증1

최근에 process macro로 구조방정식 해 달라는 분들이 많아서여. 이거 나중에 다시 한번 자세히 쓸게요. 먼저 이 방법을 지도교수가 강력하게 요구하지 않으면 하지 마세요. 이게 옛날에 나온 Baron & Kenny(1986) 방식인데 이것 문제가 많습니다. 통상 조절효과 보는 것도 이 사람들 논문 때문에 하는 것인데 이건 별 문제가 없습니다. 조절효과라는 게 통계학에서 이원분산분석이나 회귀분석에서 상호작용항에 불과한 것이거든요. 이 상호작용항이 유의적으로 나왔는가 검증하는 것에 불과합니다. 그러나 이 사람들 매개효과 보는 방법은 논리적으로나 통계 이론적으로 문제가 많습니다. 또 정확하게 매개효과 값이나 유의성을 통계학적으로 검증하지 않았고요. 이 process macro에서는 이 매개효과 유의성 ..