본문 바로가기

분류 전체보기134

회귀분석 4 회귀효과와 표준편차선에 대한 설명이 그림은 중간고사 점수(x축)와 기말고사 점수(y축)의 관계를 보여주며, 회귀효과를 시각적으로 설명하고 있습니다. 그림의 주요 요소와 그 의미를 자세히 설명해 드리겠습니다:그림의 주요 요소두 개의 직선:회귀직선(기울기가 완만한 직선): 중간고사 점수로 기말고사 점수를 예측하는 직선표준편차선(기울기가 가파른 직선): 표준화된 점수가 동일한 점들을 연결한 직선(등표준화선)세 개의 타원형 영역:중앙 타원: 중간고사에서 평균 점수를 받은 학생들오른쪽 타원: 중간고사에서 평균보다 높은 점수를 받은 학생들왼쪽 타원: 중간고사에서 평균보다 낮은 점수를 받은 학생들회귀효과의 의미1. 평균 부근의 학생들중간고사에서 평균 점수를 받은 학생들은 기말고사에서도 평균적으로 평균 점수를 받습니다.. 2025. 5. 6.
회귀분석3 정규분포와 두 변수 간의 관계1. 단일 변수와 정규분포강의 초반부에서는 단일 변수가 정규분포를 따를 때 적용할 수 있는 원리를 언급하고 있습니다. 정규분포의 68-95-99.7 법칙을 통해 z값(표준화된 점수)과 백분위(상대적 등수) 간의 관계를 파악할 수 있다고 설명합니다.2. 두 변수 간의 관계와 회귀직선두 변수가 있을 때는 하나의 변수로부터 다른 변수의 값을 예측할 수 있음회귀직선은 평균점을 지나며, 기울기는 상관계수와 관련됨구체적으로: x의 표준편차가 1단위 증가할 때, y는 y의 표준편차의 상관계수(r)배만큼 증가함3. 상관계수의 의미와 영향상관계수는 두 변수 간 관계의 강도를 나타냄예시: 중간고사에서 상위 16%(z=+1)인 학생이 기말고사에서는?상관계수가 0.8이면 기말고사 z값은 0.8이 .. 2025. 5. 6.
회귀분석2 평균의 그래프와 회귀직선회귀직선은 평균 그래프를 하나의 직선으로 근사 시킨것. 우리는 동시에 회귀함수도 알 수 있다. 함수는 x를 넣을때 y가 뭐가 나오는지 아는 방법이다. 회귀직선의 개념과 의미회귀직선의 구성 방법:키를 구간별로 나누어 각 구간에 속하는 사람들의 평균 몸무게를 계산이 평균점들을 직선으로 근사하여 만든 것이 회귀직선변수의 역할:키(x): 분류지표 또는 설명변수몸무게(y): 관심 변수(종속변수)"y의 x에 대한 회귀직선(regression of y on x)"이라고 표현회귀직선의 기능:x값(분류지표)을 입력하면 y값(관심변수)의 예측치를 제공하는 함수선형함수 형태로 표현되어 예측에 활용실용적 의미:분류지표(x)에 대한 정보가 있으면, 관련된 집단의 평균적 특성을 예측 가능전체 집단의 평균보.. 2025. 5. 6.
회귀분석 1. 변수간의 관계이 텍스트와 이미지들은 통계학 강의에서 회귀분석에 관한 개념을 설명하고 있습니다. 주요 내용을 상세히 설명해 드리겠습니다:회귀분석의 기본 개념회귀분석(regression analysis)은 점들의 평균을 분석하는 통계적 방법입니다. 회귀분석은 독립변수(x)와 종속변수(y) 간의 관계를 수학적 모델로 나타내는데, 분석 대상 변수의 수에 따라 단순회귀분석과 중회귀분석으로 나뉩니다.상관계수가 1보다 작으면 다른 요인도 있다는 뜻. 키와 몸무게의 상관관계를 찾는 자리에서 키 말고도 몸무게에 영향을 미치는 다른 요소가 많다는 뜻이다. 예를 들어 키의 z 값이 +2 일때 몸무게의 z값은 +2보다는 작을거다. +2 z 값에 몸무게 +2 z 값이 대응하는 직선이 표준편차선인데 키에 +2라고 하는 z값.. 2025. 5. 6.
일반 선형 회귀모델과 로그 변환 모델의 차이 일반 선형 회귀모델과 로그 변환 모델의 차이일반 선형 회귀모델 (y = a + bx)일반 선형 모델에서 계수 b의 의미: x가 1단위 증가할 때 y가 얼마나 많이 증가하는지를 나타냄예: b = 5라면, x가 1 증가할 때 y는 5만큼 증가로그 변환 모델 (log y = a + bx)로그 변환 모델에서 계수 b의 의미: x가 1단위 증가할 때 y가 몇 퍼센트 변화하는지를 나타냄이를 수학적으로 증명하는 과정:x = 0일 때: log y = a → y = e^ax = 1일 때: log y = a + b → y = e^(a+b)두 값의 비율: e^(a+b) / e^a = e^be^b ≈ 1 + b (b가 작을 때)따라서 b는 대략 (변화된 y - 원래 y) / 원래 y 와 같음이는 y의 퍼센트 변화를 의미함실제.. 2025. 5. 5.
상관관계와 회귀직선 1. 자료의 선형 근사데이터를 분석하다 보면 변수들간 관계가 비선혀 관계일 수도 있다. 상관계수는 선형관계일 때만 유효하다. 그래서 적절한 조치로 비선형 관계를 선형 관계로 바꿔 줘야한다. 왼쪽 그림은 x와 y가 비선형 관계다. 하지만 y에 로그화 함으로써 x,y는 선형 관계가 됐다. 앞서 공부한 나폴레옹 사례도 보자. 이와 유사한 사례다.이 자료는 행군하는 거리당 몇명이 죽었는지를 보여주는 함수다. 보시다시피 선형 관계다. 이 자료도 병사수를 나타내는 y를 log화 하면 선형관계를 얻을 수 있다.선형관계가 된 나폴레옹 군 진격. 여기까지가 워밍업이었다. 이번에는 조금더 자세하고 구체적으로 살펴보자이 식을 이런 직선을 linear spline equation이라고 한다. 여기서 새로운 개념 knots가 .. 2025. 5. 5.