행렬, 고유값(eigenvalue), 다변량 통계 1. 들어가면서 행렬, 고유값, 통계, 특히 다변량분석과의 관계에 대해서는 몇 편의 글을 써야 할 것 같네요. 글 하나로는 부족할 것 같고요. 들어가기 전에 먼저 언급할 사항은 1) 2차원에서는 원, 타원, 그리고 3차원에서 생각하면 구, 타원체(럭비공 모양)에 대해 이야기 할 겁니다. 따라서 .. 기타통계이야기/행렬,고유값(eignevalue),다변량통계 2013.04.06
베이지안 생각하기 1. 베이지안 공식의 의미 베이지안에 대해서 조금 더 이야기해볼까요? 베이지안 정리 공식입니다. f(세타|x)=f(x|세타)*f(세타) 여기서 f는 확률분포를 전반적으로 가리키는 일반적인 표시로 보시면 됩니다. f(세타)를 사전(prior)확률이라고 하고 f(세타|x)를 사후(posterior)확률이라고 합니다. 그.. 기타통계이야기/베이지안 생각하기 2013.04.05
확률분포와 우도함수(가능성 함수) 이해하기 지금 옛날에 공부한 것이 제대로 기억이 안나 정확한지는 모르겠고요. 확인할 시간이 없어서요. 나중에 잘못된 것이 있으면 수정하겠습니다. 일반적으로 확률공간(Probability Space)라면 세 개의 요소가 들어 있는 집합공간입니다. 로 정의됩니다. 여기서 시그마는 표본공간(sample space)라고 .. 기타통계이야기/확률분포와 우도함수 2013.04.01
성적취향과 인권감수성, 해가 뜰 확률... 1. 성취향과 인권감수성의 관계 최근 모 인권운동교수 사건으로 좀 시끄러웠죠. 그 사건에 대해 이야기를 하려고 하는 것이 아니고요. 거기에 관련해서 통계문제를 좀 생각해보자는 것이죠. 사람의 성적 취향을 SM, 비SM 등 이진 변수로 취급하고요, 인권감수성도 인권적, 비인권적 이진변.. 기타통계이야기/성적취향과 인권감수성의 관계 기타 2013.03.30
표본수와 이상치 그 응용 일단 표본수(설문응답자수)가 많으면 중심극한정리나 대표본 성질에 의해 정규분포로 가지 때문에 이론적으로 좋습니다. 그런 문제를 떠나 직관적으로 이해를 하면 표본수가 적으면 일단 이상치(outlier)에 의해 통계결과가 심각하게 왜곡될 수 있습니다. 조사한 사람이 10명 미만인데 유.. 기타통계이야기/표본수와 이상치 2013.03.26
카드뽑을 확률, 엔트로피 다음 두가지 문제를 생각해보죠. 카드 52장(삽13, 하13, 다13, 클13)을 책상위에 가지런이 쌓아 놓고 문제를 냅니다. 1) 위에서 세번째 카드를 뽑았을 때 하트가 나올 확률은? 2) 위에서 20번째 카드를 뽑았을 때 하트가 나올 확률은? 아마 꼭 풀어야 하는 수험생이라면 첫 번째 문제는 위에서 첫.. 기타통계이야기/카드 뽑을 확률 2013.03.17
로또 당첨 가능성을 높힐 확률 로또 당첨 가능성을 조금이라도 올릴 수 있을까요? 사기꾼들이 무슨 이상한 통계기법을 사용하여 올릴 수 있다고 하는데 다 사기입니다. 이론적으로는 불가능하다는 것이죠. 로또 숫자가 0-9까지 랜덤하게 나오지 않는 경우 로또 숫자가 나오는 기계적 과정을 알고 이 공학과정을 수식화.. 기타통계이야기/로또 가능성을 높힐 확률 2013.03.17
여론조사 신뢰구간, 신뢰수준(첨가합니다) 이번에는 여론조사에서 많이 나오는 신뢰수준과 신뢰구간에 대해 간단히 알아 볼까요. 신뢰수준과 신뢰구간은 서로 상충적인 개념입니다. 즉, 신뢰수준을 높이고 신뢰구간이 늘어나고, 신뢰수준을 낮추면 신뢰구간이 좁아집니다. 신뢰구간이 커지면 좋은 것으로 생각히시면 이 신뢰구.. 기타통계이야기/여론조사 신뢰구간 신뢰수준 2013.03.16
알통이 굵으면, 얼굴이 예쁘면 보수? 참 난감한 논문이네요. 알통이 굵으면 보수적이라. 통계학적으로는 간단한 논문인데 논리적으로 받아드리기 힘들죠. 어린 나이때는 생물학적인 충동에 많은 영향을 받지만 학교 졸업하고 사회생활을 하면 사회화 과정이 생기죠. 따라서 이런 인과 논리를 받아 드리기 힘들죠. 조만간에.. 기타통계이야기/알통이 굵으면 보수? 2013.02.21