1. 모평균을 몰라도 모분산을 추정
앞 강의에서 표본분산 s^2과 비례하는 통계량 W가 카이제곱분포를 한다는 것을 알았다. 표본분산의 계산에는 모평균 μ를 사용하지 않는 대신에 표본평균 x̄를 사용하기 때문에 W의 분포를 사용하기 위해서는 모평균을 몰라도 상관없다. 이로써 바라던 추정 방법을 알 수 있게 되었다. 정규모집단에서 필요 없는 지식은 아무것도 가정하지 말고 추정한다. 오늘 공부 할 내용은 모평균도 모분산도 모르는 정규모집단에서 나온 표본에서 모분산을 추정한다는 구간추정 방법을 설명한다.
왜 모평균이 아닌 모분산을 추정하냐고 묻는 이를 위해 미리 답하겠다. 당신은 똑똑하다. 모평균이 기본적인 모수라 이것을 추정하는 게 효율적이라 할 수 있다. 아직은 나의 지식이 부족하다. 모평균을 추정하기 위해서는 t분포라고 하는 새로운 분포를 공부해야 한다. 이것은 20강 21강에서 공부한다.
나는 앞 강의에서 정규모집단에서 관측된 n개의 표본에서 표본분산 s^2을 만들고 이것을 W라는 통계량으로 변환하면 이것은 자유도 (n - 1)인 카이제곱분포를 한다는 사실을 알았다. 카이제곱분포에 대해서는 95% 예언적중구간을 알고 있기 때문에 이것으로 모분산의 구간 추정이 가능하다.
1단계
관측된 데이터 n개로 표본평균 x̄를 구한다. 표본평균 x̄로 편차를 구하고 표본분산 s^2도 계산한다.
2단계
표본분산 s^2에 n을 곱하고 모분산 σ^2으로 나누어 통계량 W를 만든다.
3단계
자유도 (n - 1)인 95% 예언적중구간을 조사한다.
4단계
W가 3단계 구간에 들어가는 σ^2을 남기고, 들어가지 않은 σ^2을 기각시킨다. 그리고 모분산 σ^2의 95% 신뢰구간을 구한다.
1단계 2단계는 겹치는 부분이 많다. 1단계와 2단게에서 n으로 나누고 n을 곱하는 필요 없는 계산을 해서 실용적으로 이 둘을 합한 다음과 같은 순서로 계산해도 무방하다.
1단계 + 2단계
관측된 데이터 n개로 표본평균 x̄를 계산한다. 이걸로 편차를 만들고 모분산 σ^2으로 나누어 통계량 W를 만든다.
이것으로 정규분포인것 말고는 모르는 모딥단의 모수를 추정하는 것이 실현됐다. 이것이 가능한 이유는 표본평균을 사용해도 카이제곱분포를 따르는 통계량 W를 얻을 수 있다는 것을 알았기 때문이다.
2. 모분산 추정의 구체적인 예
예제
어떤 나비의 모길이가 정규모집단이라고 한다. 관측된 5마리의 몸 길이가 76mm, 85mm, 82mm, 80mm, 77mm일 때, 모분산 σ ^ 2의 95% 신뢰구간을 구하시오.
1단계
표본평균을 계산한다.
x̄ = (76 + 85 + 82 + 80 +77) / 5 = 80
표본분산을 계산한다.
s^2 = ((-4) ^ 2 + (+5) ^ 2 + (+2) ^ 2 + 0 ^ 2 + (-3) ^ 2 )/ 5 = 10.8
2단계
W를 만든다.
W = (n*s^2) / σ^2 = 5 * 10.8 / σ^2 = 54 / σ^2
3단계
자유도 (5 - 1)4인 카이제곱분포의 95% 에언적중구간은 0.4844 <= 54 / σ^2 <=11.1433
계산을 하면
4.85 <= σ^2 <= 111.48이 된다. 이건 분산이니 루트를 씌어서 표준편차를 구하면
2.2 <= σ <= 10.6
'통계학 > 세상에서 가장 쉬운 통계학 입문' 카테고리의 다른 글
21강 t분포로 구간추정 (0) | 2025.03.26 |
---|---|
20강 : t 분포 (0) | 2025.03.25 |
18강. 표본분산의 분포는 카이제곱 분포 (0) | 2025.03.21 |
17강 정규모집단의 모분산을 추정 (0) | 2025.03.15 |
16강 카이제곱 분포 (0) | 2025.03.13 |