데이터분석/기초통계

왜 불편분산에서 n이 아닌 n-1 로나누는가?

늘근이 2018. 3. 24. 10:57

일단, 분편분산의 기대값은 시그마제곱이며, 불편분산은 한 표본안에 들어있는 분산을 계산한건데, 이와중에 이상하게 n이 아닌 n-1로 푼다. 만약 n으로 계산한다면 표본분산과 미묘한 차이가 있게 된다. n-1 / n만큼의.. 왜 그런지 수학적으로 정리를 해놓은 강좌가 밑에 링크에 있다.

밑의 날림글씨를 보지말고 해당 강좌에 들어가서 따봉 해주고 보면된다. 고등학생은 꼭보라고 하는데 고등학생만 꼭 보라는것 같아 직장인이 되서 보려니 좀 쑥쓰럽다.

결국 n이 아니라 n-1로 나눠야 딱 모분산과 분편분산의 기대값이 일치하게 된다. 이 n-1을 자유롭게 둥둥 떠다니는 놈이라고 해서 자유도라고 부르고, 좀더 추상적으로 이해해 보자면 어차피 표본 분산을 구할때의 X1 - Xbar ... 에 해당되는 부분을 다 더한값은 0이 되어야 하므로, 결국 그중에 한놈은 서로서로 묶여서 이미 결정되어버린 값이기 때문에 그러타.. 라고 보면된다. 신기방기


참조 :

https://www.youtube.com/watch?v=WfiRjHATlrg

그림으로 설명하는 개념쏙쏙 통계학