본문 바로가기
통계학/세상에서 가장 쉬운 통계학 입문

2강 평균값의 역할과 평균값을 이해하는 방법

by 수스리 2025. 2. 15.

1. 통계

1.1 통계량은 데이터를 요약한 수치

도수분포표나 히스토그램은 일상에 널리 쓰이고 요약성이 뛰어난 장점이 있다. 하지만 그래프를 보는 사람이 주관적인 해석이 들어 갈 수 있다는 단점이 있다. 이러면 의사소통에서 어려움이 있다. 두번째 단점은 도수분포표나 히스토그램은 많은 공간을 필요로 한다.  이런 단점들은 극복하기 위해 또 다른 축약 방법이 발명 되었다. 바로 통계량이다. 통계량은 데이터의 어떤 비슷한 특징을 요약하고 싶은가에 따라서 여러 가지 통계량이 개발되었다. 

대표적으로 '평균값', '분산', '표준편차'가 있다. 오늘 알아 볼 것은 평균값이다.  

2.2

평균값은 익히 알던대로 유명하다. 데이터의 합계를 데이터 총 개수로 나눈 값이다. 

3. 도수분포표에서 평균값

도수분포표에서도 평균값을 계산 할 수 있다. 결론을 말하면 (계급값x상대도수)를 계산해 합계를 구하면 평균값이 나온다. 데이터에서 얻은 (앞에서 배우겠지만) 산술평균으로 나눈 값과 (계급값x상대도수)로 얻은 값 과 큰 차이가 나지 않는다. 

{(계급값 x 상대도수)의 합계}은 통계학 전반에 걸쳐서 사용 하는 것이다. 

평균값={(계급값x도수)의 총합} / (총 데이터 수) = (계긊값) x {(도수)/(총 데이터 수)}의 총합

(도수/총 데이터 수)는 상대도수이기 떄문에 (계급값X상대도수)의 총합이 된다. 각 데이터들을 계급값으로 바꿔도 큰 오차가 생기지 않는다. 오차는 중간 값이니 오차가 생겨도 +값과 -값이 서로를 상쇄하기 때문이다. 같은 계급의 모든 데이터 합계는 (계급값X도수)로 바꾸어도 큰차이가 나지  않는다.

 4. 평균값을 이해하는 방법

데이터는 수치적으로 널리 퍼져있지만, 그 널리 퍼져있는 것 중에 하나의 수를 모든 데이터를 대표하는 수로 뽑은 것이 평균값이다. 보통 데이터들은 평균값 주변에 분포되어 있다. 그다음으로 중요 한점은 많이 나타나는 데이터는 평균값에 주는 영향력이 크다. 계급에 상대도수를 곱하기 때문이다. 상대도수가 커지면 당연히 값에도 영향을 준다. 또 한가지 중요한 점은 히스토그램이 좌우대칭일 경우, 평균값은 대칭이 되는 축에 자리한다.

마지막으로 모든 데이터가 같은 숫자라고 가정할 경우, 평균값은 합계의 의미로 봤을 때 원래의 데이터로 보기에도 손색이 없을 정도의 수다.

(평균값)+(평균값)+....(평균값)= 모든 데이터의 합

 

핵심

1. 평균값 = (계급값 x 상대도수의 합계)

2. 히스토그램이 지랫대면 평균값은 균형을 이루는 지점

3. 평균 값의 성질

  • 데이터는 평균값 주변에 분포한다.
  • 많이 나타나는 데이터가 평균값에 주는 영향력은 크다
  • 히스토그램이 좌우 대칭인 경우, 그 대칭축을 지나는 점이 평균값이 된다.

평균을 구하는 여러가지 방법

두 수 x와 y의 평균을 구한다고 가정하자.

1. 산술평균

모든 수를 더 하고 총 개수로 나눈다. (x + y) / 2

2. 기하평균 혹은 상승평균

루트(xy)로 평균을 구하는 방식. 같은 수를 두 번 곱한 값이 x와 y를 곱한 값과 같도록 한다면 그 수는 무엇인가

상장률 평균을 구할 때 잘 사용된다. 한 기업의 어느 해 매출이 50% 성장했고 다음 해에는 4% 감소했을 때 기업의 매출 성장률을 2년 동안 자료로 계산하면 루트(1.5*0.96) = 루트(1.44) = 1.2 가 된다. 성장률은 20%다. 결국 2년 연속 20%씩 성장한 경우와 결과적으로 같다. 2년 연속 20%씩 성장하면 1.2 X 1.2 = 1.44로 매출은 1.44배가 된다.

3. 제곱평균

각 데이터를 제곱하여 더하고 총 개수로 나눈 위에 루트를 하는 방법이다.

루트((x^2 + y^2 ) / 2) 표준편차를 구할 때 사용한다.

4. 조화평균

(2 / (1/x) + (1/y)). 속도를 구할 때 사용된다

 

산술평균은 덧셈의 의미로 본질을 유지하려 할 때, 기하평균은 성장률을 다루면서 곱셈의 의미로 본질을 유지할 때, 조화 평균은 속도를 다룰 때 사용한다.

'통계학 > 세상에서 가장 쉬운 통계학 입문' 카테고리의 다른 글

5강 표준편차2  (0) 2025.02.21
04 강의. 표준편차  (0) 2025.02.19
3강 분산과 표준 편차  (0) 2025.02.18
1강 도수분포표와 히스토그램  (0) 2025.02.13
들어가기전  (0) 2025.02.13