본문 바로가기
통계학/세상에서 가장 쉬운 통계학 입문

18강. 표본분산의 분포는 카이제곱 분포

by 수스리 2025. 3. 21.

1. 표본분산과 비례하는 통계량 W를 만드는 법

앞 강의에서 정규모집단에서 관측된 표본에서 모평균 μ를 뺀 수를 모표준편차σ로 나누고, 이것을 제곱하고 모두 더하여 카이제곱분포를 따르는 통계량 V를 계산하고 이 분포의 95% 예언적중구간을 이용하여 구간추정을 했다. 참고로 여기서는 모평균 μ를 알고 있다는 조금 부자연스러운 가정으로 계산했다. 왜냐하면 데이터에서 모평균을 빼고, 모표준편차로 나눔으로써 표준정규분포를 하듯이 만들고, 이것을 제곱한 모든 것을 더한 것이 카이제곱분포가 되기 때문에 이러한 부자연스러운 지식이 필요했다.

V를 만드는 공식은

{(데이터) - (모평균 μ)} ^ 2인데 중괄호 안에 들어 있는 것이 (편차) ^ 2과 비슷하다.

통계량 V는 모평균을 뺀다. 표본분산 s^2은 표본평균 x̄를 빼고 편차를 만든다. 그러면 V는 카이제곱분포를 하는 통계량이 된다. 여기서 모평균  μ가 아니라 표본평균 x̄를 빼고 제곱한 것들을 더하면 카이제곱분포를 하는 성질은 없어질까? 정답은 NO. 아주 조금만 변경하면 카이제곱분포의 성질은 유지된다.

우선 두 공식을 비교 해 보자

W = {(표본) - (표본평균)}^2 / (모분산의 합)

표본분산의 공식

우리가 주목할 점은 분자다. 표본분산 s^2에 데이터 수 n을 곱한 것 = W에 모분산 σ ^ 2을 곱산것과 같다

n * s^2 = (σ ^ 2) * W

요약하면 W는 표본분산에 비례하는 통계량이다.

2. 표본분산의 카이제곱분포는 자유도가 하나 낮은 수가 된다

W = {(표본) - (표본평균)}의 제곱 / (모분산)의 합으로 얻을 수 있는 통계량 W도