논문통계해석하기 4

벤포드, 가설검증, p 값, 베이지안. 엔트로피

음 이 글을 어디에 써야 할지 모르겠는데요. 나중에 통계 부분에도 좀 더 정확하게 해서 한번 쓸게요. 한겨레에 숫자에 대한 컬럼을 쓰는 친구가 있는데 이번에는 p value라는 것에 썼는데 이게 좀 문제가 많은 기사고, 또 일반 사회과학 전공하는 사람들이 너무 잘못 알고 있는 것이 많아서..

통계 결과가 안 좋을 때

통계 결과가 안 좋으면 참 골치 아프죠. 연구모형 가설 검증은 대부분 회귀분석, 로지스틱 회귀분석, 구조방정식 등으로 하는데 연구 결과가 안 좋다는 이야기는 상식적인 결과가 안 나왔다는 이야기죠.  원칙적으로 통계 결과를 조작하려면 데이터 자체를 조작해야 합니다. 그러나 이런 작업은 매우 힘든 작업입니다. 어떤 결과를 고치려고 데이터를 조작하면 다른 결과에서 이상한 결과가 나올 수가 있거든요.  물론 데이터를 고치지 않고 전문가들은 조작을 할 수도 있습니다. 하여간 이런 것은 별로 안 좋겠죠. 특히 안전이나 과학적인 분야는 절대 조작을 해서는 안 됩니다.  하여간 이런 결과가 안 좋을 때 어떻게 해야 할 지 물어 보시는 분들이 많습니다. 여기서 간단히 조언을 하면요.  1.  일단 연구 변수들간의 상관관..

학위논문 통계분석 간략 설명

하위 논문에서 가장 빈번하게 쓰이는 통계 분석을 간략하게 알아보죠.  1. 신뢰도 타당도 분석  이건 실제 논문 주제와 관련된 분석은 아닙니다. 실제 분석에 들어가기 전에 설문지 문항에 적절하기 한번 알아보는 것에 불과합니다. 사회과학이나 우리나라 사회과학 교수들이 여기에 너무 신경을 쓰는 것 같습니다. 물론 자신이 처음으로 개발한 설문문항은 철저히 해야 합니다. 그러나 대부분 학위논문은 기존에 학계에서 개발되고 검증받은 설문문항입니다. 그리고 설문문항을 읽어봐도 다 타당한 설문문항들이고요.  하여간 여기서 좋지 않다고 판단되는 설문문항은 제거해야 합니다. 이 말은 실제 데이터상에서는 그 설문문항에 대한 값들이 들어 있지만 마치 없는 것처럼 처리한다는 이야기입니다. 예를 들어 스트레스 중 경제적 스트레스..

논문통계 해석

많은 분들이 통계 해석하는데 걱정들을 많이 하는데요 생각보다 어렵지 않습니다. 1. 먼저 제일 먼저 걱정하는 것들이 t, F, X2 (카이제곱이라 읽습니다) 보면 겁을 냅니다. 겁을 낼 필요가 전혀 없습니다. 이것들은 통계학에서 나오는 분포들인데 통계 전공아닌 사람은 전혀 알 필요가 없습니다. 더구나 위의 분포는 흔히 정규분포와 같이 현실에서 관찰되는 분포도 아니고 통계 이론 전개상에서 나오는 완전한 이론적인 분포입니다(t 분포는 분포 꼬리가 두꺼워서 리스크 관리 분야에서 사용될 수 있습니다). 그래서 통계을 전공하지 않은 분들은 이 분포에 대해서 전혀 알 필요가 없습니다. 2. 통계표에서 여러분이 알아야 할 것은 빈도, 백분율(%), 평균, 상관계수와 회귀계수, 그리고 그 부호, 그리고 p 값입니다. ..