t검증,분산분석,F검증,ANOVA 3

통계 해석 분산의 이해

통계학에서 가장 중요한 개념이 평균과 분산입니다. 일반적인 수학에서는 이진 논리 세계(옳거나 틀리다)를 다루는 것이지만 통계에서는 확률적인 세계를 다루는 것입니다. 즉 어떤 현상은 하나의 값을 가지는 것이 아니라 분포를 가진다는 것이죠. 그런데 이 분포를 설명하는데 가장 중요한 값이 중심값이고 또 하나는 변동입니다. 중심값에서 가장 중요한 것이 가장 많이 쓰이는 평균이 있고, 분포가 대칭이 아닌 경우, 즉 소득, 아파트 가격 등 경제 변수 경우 중앙값(median)을 많이 쓰고, 범주형 자료 같은 경우는 최빈값을 쓰기도 합니다. 변동(variation)을 측정하는 값으로 가장 많이 사용하는 값이 분산(variance)입니다. 엔트로피도 있고, 또 다른 값도 있는데 지금은 분산(또는 표준편차)로 굳어져 있..

t 검증, 분산분석의 F 검증, 사후검증

이번에는 성별, 학력 등 범주형 자료에 따라 연속형 변수가 차이가 있는지 검증하는 것을 보겠습니다. 통상 연속형 변수로는 자연과학에서 많이 나오는 변수나 교육학에서 많이 하는 시험점수, 또는 사회과학 논문에 많이 나오는 Likert형 변수들을 많이 사용합니다. 다음 예는 시골과 도..