본문 바로가기
통계학/세상에서 가장 쉬운 통계학 입문

19강 모평균이 미지인 정규모집단을 구간추정

by 수스리 2025. 3. 21.

1. 모평균을 몰라도 모분산을 추정

앞 강의에서 표본분산 s^2과 비례하는 통계량 W가 카이제곱분포를 한다는 것을 알았다. 표본분산의 계산에는 모평균 μ를 사용하지 않는 대신에 표본평균 x̄를 사용하기 때문에 W의 분포를 사용하기 위해서는 모평균을 몰라도 상관없다. 이로써 바라던 추정 방법을 알 수 있게 되었다. 정규모집단에서 필요 없는 지식은 아무것도 가정하지 말고 추정한다. 오늘 공부 할 내용은 모평균도 모분산도 모르는 정규모집단에서 나온 표본에서 모분산을 추정한다는 구간추정 방법을 설명한다.

 

왜 모평균이 아닌 모분산을 추정하냐고 묻는 이를 위해 미리 답하겠다. 당신은 똑똑하다. 모평균이 기본적인 모수라 이것을 추정하는 게 효율적이라 할 수 있다. 아직은 나의 지식이 부족하다. 모평균을 추정하기 위해서는 t분포라고 하는 새로운 분포를 공부해야 한다. 이것은 20강 21강에서 공부한다.

 

나는 앞 강의에서 정규모집단에서 관측된 n개의 표본에서 표본분산 s^2을 만들고 이것을 W라는 통계량으로 변환하면 이것은 자유도 (n - 1)인 카이제곱분포를 한다는 사실을 알았다. 카이제곱분포에 대해서는 95% 예언적중구간을 알고 있기 때문에 이것으로 모분산의 구간 추정이 가능하다.

 

1단계

관측된 데이터 n개로 표본평균 x̄를 구한다. 표본평균 x̄로 편차를 구하고 표본분산 s^2도 계산한다.

 

2단계

표본분산 s^2에 n을 곱하고 모분산 σ^2으로 나누어 통계량 W를 만든다.

 

3단계

자유도 (n - 1)인 95% 예언적중구간을 조사한다.

 

4단계

W가 3단계 구간에 들어가는  σ^2을 남기고, 들어가지 않은  σ^2을 기각시킨다. 그리고 모분산  σ^2의 95% 신뢰구간을 구한다.

 

1단계 2단계는 겹치는 부분이 많다. 1단계와 2단게에서 n으로 나누고 n을 곱하는 필요 없는 계산을 해서 실용적으로 이 둘을 합한 다음과 같은 순서로 계산해도 무방하다.

 

1단계 + 2단계

관측된 데이터 n개로 표본평균 x̄를 계산한다. 이걸로 편차를 만들고 모분산  σ^2으로 나누어 통계량 W를 만든다.

 

이것으로 정규분포인것 말고는 모르는 모딥단의 모수를 추정하는 것이 실현됐다. 이것이 가능한 이유는 표본평균을 사용해도 카이제곱분포를 따르는 통계량 W를 얻을 수 있다는 것을 알았기 때문이다.

 

2. 모분산 추정의 구체적인 예

예제

어떤 나비의 모길이가 정규모집단이라고 한다. 관측된 5마리의 몸 길이가 76mm, 85mm, 82mm, 80mm, 77mm일 때, 모분산 σ ^ 2의 95% 신뢰구간을 구하시오.

 

1단계

표본평균을 계산한다.

x̄ = (76 + 85 + 82 + 80 +77) / 5 = 80

표본분산을  계산한다.

s^2 = ((-4) ^ 2 + (+5) ^ 2 + (+2) ^ 2 +  0 ^ 2 + (-3) ^ 2 )/ 5 = 10.8

 

2단계

W를 만든다.

W = (n*s^2) / σ^2 = 5 * 10.8 / σ^2 = 54 / σ^2

 

3단계

자유도 (5 - 1)4인 카이제곱분포의 95% 에언적중구간은 0.4844 <= 54 /  σ^2 <=11.1433

계산을 하면 

4.85 <= σ^2 <= 111.48이 된다. 이건 분산이니 루트를 씌어서 표준편차를 구하면

2.2 <= σ <= 10.6