데이터분석/기초통계

카이스퀘어 동질성 / 독립성 검증 정리

늘근이 2018. 4. 7. 10:15
  • 동질성 검증: '변인의 분포가 이항분포나 정규분포와 동일하다'라는 가설을 설정한다. 이는 어떤 모집단의 표본이 그 모집단을 대표하고 있는지를 검증하는 데 사용한다.
  • 독립성 검증: 변인이 두 개 이상일 때 사용되며, 기대빈도는 '두 변인이 서로 상관이 없고 독립적'이라고 기대하는 것을 의미하며 관찰빈도와의 차이를 통해 기대빈도의 진위여부를 밝힌다.


p-value가 정해진 수준 0.1 이나 0.05보다 작으면 제대로된 랜덤 샘플링이 아닌 특이값이라는 것인데, 위의 경우는 p-value가 기각하지 못하므로, 해당 모집단에서 나왔다는 귀무가설을 기각하지 못한다.