1. 예언적중구간을 추정에 역이용
검정이란 가설을 바탕으로 하여 모집단에서 나오는 데이터를 95% 예언적중구간에서 예언한다고 하면, 현실에서 관측된 데이터가 에언에 들어가 있는가를 계산하고, 들어가 있지 않다면 가설을 버리고, 들어 있다면 가설을 가능성으로 둔다
이 가설의 평가법을 모든 모수 각각에 실행하면 '버릴 수 없는 가능성으로 두어야 하는 모수의 집합'이 확정될 것이다. 모수의 집합을 '가능한 모집단의 모수로 추정되는 구간'으로 보는 것은 아주 자연스러운 일이다. 이렇게 있을 수 있는 모수가 들어있는 구간을 95% 신뢰구간이라고 하며, 모수를 이러한 구간에서 추정하는 것을 '구간추정'이라고 한다.
동전을 예제로 든다
동전 N개를 던지는 실험을 해서 앞면이 10개 나왔다. 던진 개수를 N이라고 생각할 수 있는 것은 몇 개에서 몇 개까지 일까?
동전 개수의 가설검정 ( σ == 시그마, μ == 뮤)
모수 N에 대하여 동전 N개를 던져서 앞면이 나오는 개수의 데이터를 모집단으로 하면, 이것은 정규분포를 따르며 평균값은 μ = (N / 2), 표준편차 σ = (루트(N)/ 2)이다. 이때 z를 z = (10 - μ / σ)로 계산하여 부등식 -1.96 <= z <= 1.96이 성립하는 N은 기각하지 않는다. 그러나 성립하지 않는 N은 기각한다.
부등식을 계산해보면 N의 95% 신뢰구간은 13<=N<=30으로 추정할 수 있다.
2. 신뢰구간 '95%'가 의미하는 것
신뢰구간 95%라는 말은 95%의 데이터가 그 구간에 들어가 있다는 것을 의미한다. 그래서 다음에 관측하는 데이터는 95% 확률로 그 구간에 들어간다고 생각하면 좋다.
하지만 신뢰구간의 경우 이야기가 달라진다. '앞면이 나온 개수가 10개로 관측될때, 모수 N이 95% 확률로 이 13<= N <= 30 범위에 들어간다.
N은 '불확실하게 앞으로 결정될 것'이 아니라 '이미 확정된 것이지만, 모르는 것'이다. 도표 10-1을 주의 깊게 보면 N이 다르면 모집단은 다르다.
우리들이 다루는 불확실한 현상이란 '고정된 모집단으로부터 어느 데이터가 관측되는가'라는 것이다. 이때 결정된 일정한 구조로 확률적인 수치가 나오는 것은 모수 N이 아니라, 어디까지나 관측되는 수치이다.
결국 구간추정이라는 과정을 계속 실행하면, 관측값에 대응하는 여러 구간을 구할 수 있지만, 그 100번 중 95번은 N이 구해지는 구간에 들어간다.
3. 표준편차를 아는 정규모집단의 평균값에 대한 구간추정
다른 예제를 들어보자.
모집단이 정규분포인 것을 알고 있으며, 표준편차는 알고 있지만 평균값을 모를 때, 관측된 데이터로부터 평균값을 구간추정 해보자.
예제 2
정확하지 않은 온도계로 액체의 온도를 측정한다고 해보자. 측정된 데이터는 실제로 온도 μ를 평균으로 하고 표준편차 5의 정규분포를한다. 지금 측정된 온도는 20도이다. 실제 온도로를 95% 신뢰구간에서 구간추정 하시오.
모집단이 관측값의 데이터 집합일 경우
평균값 -> 실제값
표준편차 -> 측정한 정확도
로 대응시켜서 생각할 수 있고, 측정 기계에 각각의 고유한 정확도 = 표준편차가 알려져 있는 것은 이상하지 않다. 실제 온도 μ를 구간추정 해보자
우선 추정하고 싶은 실제 온도=모집단의 평균값을 μ라고 하자. 모집단의 표준편차는 미리 σ==5 라고 알고 있다.
z = (x - μ)/ σ 식을 바탕에 두고 관측값을 20을 z = (20 - μ ) / 5 로 계산하면 답이 나온다
결과적으로 μ는 29.8>= μ>= 10.2를 만족한다.
'통계학 > 세상에서 가장 쉬운 통계학 입문' 카테고리의 다른 글
12강 모분산과 모표준편차 (0) | 2025.03.08 |
---|---|
11강. 모집단과 통계적 추정 (0) | 2025.03.05 |
08 강의 통계적 추정의 출발점 (0) | 2025.02.24 |
07 강의 정규분포 (0) | 2025.02.21 |
6강. 표준편차 3 (0) | 2025.02.21 |