1. 가장 자연스러운 구간추정
우리의 최종목표는 모집단이 정규분포라는 것만 알고 모분산은 모르는 경우, 소표본에서 모평균을 추정한다는 방법론이다. 이때 다음 방법으로 계산이 가능하다.
T = (표본평균 - 모평균) / (표본표준편차) * 루트 (n - 1)
이 통계량을 만들면, 완전하게 상대도수가 파악되는 분포인 t분포가 된다는 것을 앞 강의에서 설명했다. 이러면 95% 예언적중구간을 만들 수 있고, 이것을 이용해 검정이나 구간추정을 할 수 있게 된다.
예를 들어 자유도가 10이면 자유도 10 부분 숫자 2.228을 선택한다. 그리고 95% 예언적중구간은 0을 축으로 한 대칭구간 -2.228 <= T <= +2.228로 구한다. 즉 자유도가 10이며 t분포를 따르는 데이터 T를 예언하면 -2.228 <= T <= +2.228을 예언하면 된다.
T는 모집단에 관한 정보를 모평균 μ만 포함하고 있지 않다. 그래서 표본을 구체적으로 얻은 것을 바탕으로 어떤 모평균 μ의 수치를 가정하면 통계량 T를 계산할 수 있다. 이 계산된 T의 수가 95% 예언적중구간에 들어있지 않으면 μ를 기각한다. 이것이 검정의 발상이다.
20강 3항을 예로 들어보자.
1, 5, 7, 9, 13이라는 5개의 표본을 정규모집단에서 얻을 수 있다. 여기서 모평균 μ가 6이라는 가설은 타당할까? 결론부터 말하면 T = 0.5다. T는 자유도 4 (n - 1)인 t 분포를 따른다. T가 0.5면
-2.776 <= T <= +2.776이 되기 때문에 T = 0.5는 이 범위 안에 있다. 가설로하는 μ = 6은 5개의 표본에 의해 계산된 T를 충분히 예언할 수 있기 때문에 기강할 수 있는 터무니없는 가설이 아니다.
이와 같은 작업을 't'검정 이라고 한다. t 검정에서 살아남은 μ들을 범위로 표시 한것이 μ의 95% 신뢰구간이 된다.
2. t분포를 이용한 구간추정 방법
단계별로 t검정 해보기
1단계
얻은 n개의 표본에서 표본평균 x̄와 표본표준편차 s를 계산한다.
2단계
표본평균 x̄와 표본표준편차 s, 추정하려고 하는 모평균 μ를 사용하고 자유도 n-1인 t분포를 따르는 통계량 T를 다음과 같이 계산한다.
T = (x̄ - μ) / s * 루트(n - 1)
3단계
자유도 n-1인 95% 예언적중구간을 도표 21-1에서 선택해 - α <= T <= + α 라는 95% 예언적중구간을 만든다
4단계
- α <= {(x̄ - μ) * 루트(n - 1)} / s <= + α
구체적인 예시
나비의 몸길이
76mm, 85mm, 82mm, 83mm, 76mm, 78mm
표본평균 = (76 + 85 + 82 + 83 + 76 + 78) / 6 = 80
표본분산 = {(-4) ^ 2 + 5 ^ 2 + 2 ^ 2 + 3 ^ 2 + (-4) ^ 2 + (-2) ^ 2 } / 6 = 12.33
자유도가 (6 -1) = 5인 95% 예언적중 구간은-2.571 <= T <= +2.571
-2.571 <= (80 - μ) * 루트(5) / 3.51 <= +2.571이 부등식을 풀면75.964 <= μ <= 84.036 추정결과가 나온다
'통계학 > 세상에서 가장 쉬운 통계학 입문' 카테고리의 다른 글
회귀직선의 오차 (1) | 2025.05.09 |
---|---|
20강 : t 분포 (0) | 2025.03.25 |
19강 모평균이 미지인 정규모집단을 구간추정 (0) | 2025.03.21 |
18강. 표본분산의 분포는 카이제곱 분포 (0) | 2025.03.21 |
17강 정규모집단의 모분산을 추정 (0) | 2025.03.15 |