본문 바로가기
통계학/세상에서 가장 쉬운 통계학 입문

21강 t분포로 구간추정

by 수스리 2025. 3. 26.

1. 가장 자연스러운 구간추정

우리의 최종목표는 모집단이 정규분포라는 것만 알고 모분산은 모르는 경우, 소표본에서 모평균을 추정한다는 방법론이다. 이때 다음 방법으로 계산이 가능하다.

T = (표본평균 - 모평균) / (표본표준편차) * 루트 (n - 1)

이 통계량을 만들면, 완전하게 상대도수가 파악되는 분포인 t분포가 된다는 것을 앞 강의에서 설명했다. 이러면 95% 예언적중구간을 만들 수 있고, 이것을 이용해 검정이나 구간추정을 할 수 있게 된다.

예를 들어 자유도가 10이면 자유도 10 부분 숫자 2.228을 선택한다. 그리고 95% 예언적중구간은 0을 축으로 한 대칭구간 -2.228 <= T <= +2.228로 구한다. 즉 자유도가 10이며 t분포를 따르는 데이터 T를 예언하면 -2.228 <= T <= +2.228을 예언하면 된다.

T는 모집단에 관한 정보를 모평균 μ만 포함하고 있지 않다. 그래서 표본을 구체적으로 얻은 것을 바탕으로 어떤 모평균 μ의 수치를 가정하면 통계량 T를 계산할 수 있다. 이 계산된 T의 수가 95% 예언적중구간에 들어있지 않으면 μ를 기각한다. 이것이 검정의 발상이다.

20강 3항을 예로 들어보자.

1, 5, 7, 9, 13이라는 5개의 표본을 정규모집단에서 얻을 수 있다. 여기서 모평균 μ가 6이라는 가설은 타당할까? 결론부터 말하면 T = 0.5다. T는 자유도 4 (n - 1)인 t 분포를 따른다. T가 0.5면 

-2.776 <= T <= +2.776이 되기 때문에 T = 0.5는 이 범위 안에 있다. 가설로하는 μ = 6은 5개의 표본에 의해 계산된 T를 충분히 예언할 수 있기 때문에 기강할 수 있는 터무니없는 가설이 아니다. 

이와 같은 작업을 't'검정 이라고 한다. t 검정에서 살아남은 μ들을 범위로 표시 한것이 μ의 95% 신뢰구간이 된다.

2. t분포를 이용한 구간추정 방법

단계별로 t검정 해보기

 

1단계

얻은 n개의 표본에서 표본평균 x̄와 표본표준편차 s를 계산한다.

 

2단계

표본평균 x̄와 표본표준편차 s, 추정하려고 하는 모평균 μ를 사용하고 자유도 n-1인 t분포를 따르는 통계량 T를 다음과 같이 계산한다.

T = (x̄ - μ) / s * 루트(n - 1)

 

3단계

자유도 n-1인 95% 예언적중구간을 도표 21-1에서 선택해 - α <= T <= + α 라는 95% 예언적중구간을 만든다

 

4단계

 - α <= {(x̄ - μ) * 루트(n - 1)} / s <= + α

 

구체적인 예시

나비의 몸길이

76mm, 85mm, 82mm, 83mm, 76mm, 78mm

 

표본평균 = (76 + 85 + 82 + 83 + 76 + 78) / 6 = 80

표본분산 = {(-4) ^ 2 + 5 ^ 2 + 2 ^ 2 + 3 ^ 2 + (-4) ^ 2 + (-2) ^ 2 } / 6 = 12.33

자유도가 (6 -1) = 5인 95% 예언적중 구간은-2.571 <= T <= +2.571

 

-2.571 <= (80 - μ) * 루트(5) / 3.51 <= +2.571이 부등식을 풀면75.964 <= μ <= 84.036 추정결과가 나온다