통계학/경제통계학 1부 : 그림과 수치를 이용한 자료의 정리

일반 선형 회귀모델과 로그 변환 모델의 차이

수스리 2025. 5. 5. 20:45

일반 선형 회귀모델과 로그 변환 모델의 차이

일반 선형 회귀모델 (y = a + bx)

  • 일반 선형 모델에서 계수 b의 의미: x가 1단위 증가할 때 y가 얼마나 많이 증가하는지를 나타냄
  • 예: b = 5라면, x가 1 증가할 때 y는 5만큼 증가

로그 변환 모델 (log y = a + bx)

  • 로그 변환 모델에서 계수 b의 의미: x가 1단위 증가할 때 y가 몇 퍼센트 변화하는지를 나타냄
  • 이를 수학적으로 증명하는 과정:
    1. x = 0일 때: log y = a → y = e^a
    2. x = 1일 때: log y = a + b → y = e^(a+b)
    3. 두 값의 비율: e^(a+b) / e^a = e^b
    4. e^b ≈ 1 + b (b가 작을 때)
    5. 따라서 b는 대략 (변화된 y - 원래 y) / 원래 y 와 같음
    6. 이는 y의 퍼센트 변화를 의미함

실제 적용 예시

  1. 노동조합 효과:
    • 모델: log(임금) = a + b×(노동조합 가입 여부)
    • 만약 b = 0.10이면, 노동조합원은 비노동조합원보다 임금이 약 10% 높다고 해석
  2. 성별 임금 격차:
    • 모델: log(임금) = a + b×(여성=1, 남성=0)
    • 만약 b = -0.2이면, 여성은 남성보다 임금이 약 20% 낮다고 해석

이처럼 로그 변환 모델은 특히 경제학이나 사회과학에서 **상대적 변화(퍼센트 변화)**를 해석하기 쉽게 해주기 때문에 자주 사용됩니다. 이는 "모든 모델이 틀렸지만, 일부는 유용하다(All models are wrong, but some are useful)"라는 통계학의 원칙에 따라 완벽하진 않아도 실용적인 해석을 제공합니다.