본문 바로가기
통계학/세상에서 가장 쉬운 통계학 입문

17강 정규모집단의 모분산을 추정

by 수스리 2025. 3. 15.

정규모집단이라는 것은 알고, 모평균을 알고 있을 때의 모분산 추정

1. 카이제곱분포의 95% 예언적중구간

앞 강의에서 표준정규모집단에서 얻은 데이터를 n개 관측해서 이러한 데이터들을 제곱하고 더한 V라는 통계량을 구하면 V의 분포는 자유도 n의 카이제곱분포가 된다는 것을 설명했다.

확실한 분포를 얻으면  '95% 적중할 수 있는 예언'을 할 수 있다. 정규분포처럼 카이제곱분포도 어느 범위를 지정하고, 그 범위에 V가 들어간다고 하는 예언을 95%의 확률로 적중시키는 것이 가능하다. 

2. 정규모집단의 모분산을 추정

95% 예언적중구간을 만들 수 있다는 말은 이것을 구간추정에 이용 할 수 있음을 의미한다. 모평균 μ, 모표준편차 σ의 정규모집단에서의 표본 x로부터 z = (x - μ) / σ로 통계량 z를 만들면 z가 표준정규분포가 되기 때문에 σ를 알면, μ의 구간추정을 할 수 있음을 떠올릴 수 있다. 

만일, x와 μ, 그리고 σ로부터 카이제곱분포 하는 통계량을 만들 수 있다면, 이와 같은 구간 추정을 할 수 있다. 정규모집단에서 n개의 데이터 x1, x2, x3 ... xn의 표본이 관측된다면 이것에서 모평균 μ를 빼고, 모표준편차 σ로 나눈 수치로 바꾸어

(x1 - μ) / σ, (x2 - μ) / σ, (x3 - μ) / σ가 된다. 이것은 모두 앞에서 구한 통계량 z와 같아서 표준정규분포를 따른다.

 

일반정규모집단에서 카이제곱분포하는 V를 구하는 법

 모평균 μ, 모표준편차 σ의 정규모집단에서 n개의 표본 x1, x2, ..., xn을 관측하고, 

V = (x1 - μ / σ ) ^ 2 + (x2 - μ / σ ) ^ 2  .... 

이런 형태로 V를 계산하면 통계량 V는 자유도 n인 카이제곱분포를 한다.

 

그래서 일반적인 정규모집단의 표본으로 카이제곱분포하는 통계량을 만들면 17-1에서 해설한 '카이제곱분포의 95% 예언적중구간'을 이용하여 모분산을 구간추정 할 수 있게 된다

다만 여기서는 모펴균을 알고 있다는 부자연스러운 상황에서 추정을 설명한다. 모평균을 모르는 가정은 다음장에

 

예제

어떤 나비의 몸길이 모집단은 모평균 80mm인 정규모집단이라고 한다. 이때 관측된 3마리의 몸길이가 76mm, 85mm, 83mm일 경우, 모분산 σ^2의 95% 신뢰구간을 구하세요.

관측된 3마리의 표본에서 통계량 v를 만들면?

V = (x1 - μ / σ ) ^ 2 + (x2 - μ / σ ) ^ 2  ....  이 식을 쓴다

V = (76 - 80 / σ ) ^ 2 + (85 - 80 / σ ) ^ 2 +  (83 - 80 / σ ) ^ 2

= 50 /  σ^2이라고 한다.

이 V는 자유도가 3인 카이제곱분포를 하는 데이터 중의 하나라는 것을 알고 있다. 그래서 추정을 하는데 기본적으로 우리들은 95% 예언적중구간 중의 수치를 관측할 것이라는 생각한다. 즉 σ를 사전에 알고 95%예언적중 구간에 들어가지 않는 σ는 기각한다.

기각하지 않고 받아들이는 모집단의 모분산 σ^2는

0.2157 <= 50 / σ ^ 2 <= 9.3484를 만족 시켜야 한다. 

이를 계산하면 

모분산 σ ^ 2에 대한 95% 신뢰구간은 5.34.이상 231.80이하가 된다. 관측된 3마리의 몸길이부터 모집단의 몸길이 모분산은 5.34.이상 231.80 이하의 수치가 된다. 여기서 루트를 씌어 표준편차도 알 수 있다.