지난번에 통계학 이론을 이해하려면 평균보다 변동을 이해하는 것이 더 중요하다고 이야기했습니다. 지난번 글은 https://blog.daum.net/dataminer9/773 여기서 한국 성인의 키에 영향을 미치는 변인으로 성인 키의 차이=성별에서 오는 차이+연령대에서 오는 차이+부모 키에서 오는 차이+(성별, 연령, 부모 키 요인으로 설명되지 않는 변동) 으로 볼 수 있다고 했는데 여기서 우리가 자녀가 2명인 경우에만 키를 조사한다고 하고, 부모는 부모의 키를 재지 않고 부모1, 부모2, 부모3, 이렇게 조사한다고 하죠. 그럼 데이터는 다음과 같은 형태로 될 것입니다. id 성별 연령대 부모 키 1 남자 30대 부모1 178 2 남자 30대 부모1 174 3 여자 20대 부모2 163 4 남자 20대 부..