1. 데이터의 분포 상태를 파악
모집단의 데이터 분포 모습을 파악하기 위한 지표로 모평균을 정의했다. 모집단이라는 '가상의 항아리'에 무한개를 채운 데티터 수를 그 연못의 넓이로 가중평균하여 산출한 것이다. 이것은 실제로 충분한 횟수로 관측하여 만들어진 히스토그램에서 '데이터의 수치와 상대도수를 곱하고 모두 합하여 얻어진 것'과 대략 일치한다.
모평균 μ라고 하는 것은 모집단을 채우는 데이터가 대략 μ주변에 제각각으로 흩어져 있는 수치임을 말한다. 하지만 '어느 정도 제각작인가 = 분포한 상태'를 파악해 두지 ㅇ낳으면 분포의 모습을 파악한다고 말할 수 없고, 어딘가 자연스럽지 않은 것이 나온다. 데이터가 평균 주변에 어느정도로 넓이로 퍼져있는가를 나타내는 수치가 표준편차인데 모집단에서도 이를 계산 할 수 있다.
2. 모분산과 모표준편차의 계산
모집단 데이터의 표준편차를 '모표준편차'라고 한다. 모표준편차는 σ라는 기호로 나타낸다. 모집단의 분산을 '모분산'이라 부르 이건 루트를 씌우기 전이라 σ^2 라고쓴다. 모집단의 데이터와 그 분포가 주어지면 모분산 σ^2과 모표준편차 σ를 계산하는 것은 쉬운일디ㅏ. 충분한 횟수로 관측하여 히스토그램을 만들면 이것은
편차 = (데이터 수치) - (모평균 μ)
를 각 데이터로 게산하여
모분산 σ^2 = {(편차의 제곱) * (연못의 넓이)}의 합계
모표준편차 σ = 루트(ㅁ)
'통계학 > 세상에서 가장 쉬운 통계학 입문' 카테고리의 다른 글
14강 표본평균2 (1) | 2025.03.10 |
---|---|
13강 표본평균1 (0) | 2025.03.09 |
11강. 모집단과 통계적 추정 (0) | 2025.03.05 |
10강 구간 추정 (0) | 2025.03.03 |
08 강의 통계적 추정의 출발점 (0) | 2025.02.24 |