본문 바로가기
통계학/경제통계학 1부 : 그림과 수치를 이용한 자료의 정리

회귀분석2

by 수스리 2025. 5. 6.

평균의 그래프와 회귀직선

회귀직선은 평균 그래프를 하나의 직선으로 근사 시킨것. 우리는 동시에 회귀함수도 알 수 있다. 함수는 x를 넣을때 y가 뭐가 나오는지 아는 방법이다. 

회귀직선의 개념과 의미

  1. 회귀직선의 구성 방법:
    • 키를 구간별로 나누어 각 구간에 속하는 사람들의 평균 몸무게를 계산
    • 이 평균점들을 직선으로 근사하여 만든 것이 회귀직선
  2. 변수의 역할:
    • 키(x): 분류지표 또는 설명변수
    • 몸무게(y): 관심 변수(종속변수)
    • "y의 x에 대한 회귀직선(regression of y on x)"이라고 표현
  3. 회귀직선의 기능:
    • x값(분류지표)을 입력하면 y값(관심변수)의 예측치를 제공하는 함수
    • 선형함수 형태로 표현되어 예측에 활용
  4. 실용적 의미:
    • 분류지표(x)에 대한 정보가 있으면, 관련된 집단의 평균적 특성을 예측 가능
    • 전체 집단의 평균보다 더 정확한 예측 가능
    • 예: 키가 175cm인 사람의 평균 몸무게 예측
  5. 실제 응용 사례:
    • 경제 분야: 통화 증가율(x)과 인플레이션률(y)의 관계
    • 중앙은행의 정책 결정에 활용 가능
  6. 회귀분석의 전제:
    • 통계적 의미에서 역사가 반복된다는 가정
    • 데이터에서 발견되는 패턴이 미래에도 유지될 것이라는 전제
  7. 정보의 가치:
    • 정보는 시야를 좁혀 더 정확한 예측을 가능하게 함
    • 특정 집단에 초점을 맞춰 더 나은 결론 도출 가능

이 설명은 회귀분석이 단순히 수학적 방법론이 아니라, 정보를 활용해 예측력을 높이는 도구라는 점을 강조하고 있습니다.

이 문제는 회귀분석과 표준화 점수(z-score)를 이용하여 한 학생의 예상 성적을 계산하는 문제입니다. 문제의 단계별 설명을 드리겠습니다:

문제 상황

  • 경제원론 평균: 3.0, 표준편차(SDx): 0.70
  • 경제통계학 평균: 3.0, 표준편차(SDy): 0.60
  • 상관계수: 0.5

문제

경제원론 학점이 3.70인 지희의 경제통계학 학점은?

풀이 과정

  1. 경제원론 점수를 표준화합니다:
    • 표준화 점수(z-score) = (원점수 - 평균) / 표준편차
    • = (3.7 - 3.0) / 0.7 = 0.7 / 0.7 = 1 SD (표준편차 1개만큼 높음)
  2. 상관계수와 경제통계학 표준편차를 이용하여 경제통계학에서 예상되는 표준화 점수 차이를 계산합니다:
    • 예상되는 표준화 점수 차이 = 상관계수 × 경제원론 표준화 점수
    • = 0.5 × 1 = 0.5
    • 즉, 경제통계학에서는 표준편차의 0.5배만큼 평균보다 높을 것으로 예상
  3. 경제통계학 점수로 환산합니다:
    • 원점수 = 평균 + (표준화 점수 × 표준편차)
    • = 3.0 + (0.5 × 0.60) = 3.0 + 0.3 = 3.3

따라서 지희의 예상 경제통계학 학점은 3.3(B+)입니다.

이것은 회귀 직선을 이용한 예측의 예입니다. 앞서 설명드린 것처럼, 상관계수가 1보다 작을 때(이 경우 0.5) 회귀선은 등표준화선보다 완만하므로, 경제원론에서 표준편차 1만큼 높았다면 경제통계학에서는 표준편차 0.5만큼만 높을 것으로 예측합니다.