분류 전체보기169 회귀분석2 평균의 그래프와 회귀직선회귀직선은 평균 그래프를 하나의 직선으로 근사 시킨것. 우리는 동시에 회귀함수도 알 수 있다. 함수는 x를 넣을때 y가 뭐가 나오는지 아는 방법이다. 회귀직선의 개념과 의미회귀직선의 구성 방법:키를 구간별로 나누어 각 구간에 속하는 사람들의 평균 몸무게를 계산이 평균점들을 직선으로 근사하여 만든 것이 회귀직선변수의 역할:키(x): 분류지표 또는 설명변수몸무게(y): 관심 변수(종속변수)"y의 x에 대한 회귀직선(regression of y on x)"이라고 표현회귀직선의 기능:x값(분류지표)을 입력하면 y값(관심변수)의 예측치를 제공하는 함수선형함수 형태로 표현되어 예측에 활용실용적 의미:분류지표(x)에 대한 정보가 있으면, 관련된 집단의 평균적 특성을 예측 가능전체 집단의 평균보.. 2025. 5. 6. 회귀분석 1. 변수간의 관계이 텍스트와 이미지들은 통계학 강의에서 회귀분석에 관한 개념을 설명하고 있습니다. 주요 내용을 상세히 설명해 드리겠습니다:회귀분석의 기본 개념회귀분석(regression analysis)은 점들의 평균을 분석하는 통계적 방법입니다. 회귀분석은 독립변수(x)와 종속변수(y) 간의 관계를 수학적 모델로 나타내는데, 분석 대상 변수의 수에 따라 단순회귀분석과 중회귀분석으로 나뉩니다.상관계수가 1보다 작으면 다른 요인도 있다는 뜻. 키와 몸무게의 상관관계를 찾는 자리에서 키 말고도 몸무게에 영향을 미치는 다른 요소가 많다는 뜻이다. 예를 들어 키의 z 값이 +2 일때 몸무게의 z값은 +2보다는 작을거다. +2 z 값에 몸무게 +2 z 값이 대응하는 직선이 표준편차선인데 키에 +2라고 하는 z값.. 2025. 5. 6. 일반 선형 회귀모델과 로그 변환 모델의 차이 일반 선형 회귀모델과 로그 변환 모델의 차이일반 선형 회귀모델 (y = a + bx)일반 선형 모델에서 계수 b의 의미: x가 1단위 증가할 때 y가 얼마나 많이 증가하는지를 나타냄예: b = 5라면, x가 1 증가할 때 y는 5만큼 증가로그 변환 모델 (log y = a + bx)로그 변환 모델에서 계수 b의 의미: x가 1단위 증가할 때 y가 몇 퍼센트 변화하는지를 나타냄이를 수학적으로 증명하는 과정:x = 0일 때: log y = a → y = e^ax = 1일 때: log y = a + b → y = e^(a+b)두 값의 비율: e^(a+b) / e^a = e^be^b ≈ 1 + b (b가 작을 때)따라서 b는 대략 (변화된 y - 원래 y) / 원래 y 와 같음이는 y의 퍼센트 변화를 의미함실제.. 2025. 5. 5. 상관관계와 회귀직선 1. 자료의 선형 근사데이터를 분석하다 보면 변수들간 관계가 비선혀 관계일 수도 있다. 상관계수는 선형관계일 때만 유효하다. 그래서 적절한 조치로 비선형 관계를 선형 관계로 바꿔 줘야한다. 왼쪽 그림은 x와 y가 비선형 관계다. 하지만 y에 로그화 함으로써 x,y는 선형 관계가 됐다. 앞서 공부한 나폴레옹 사례도 보자. 이와 유사한 사례다.이 자료는 행군하는 거리당 몇명이 죽었는지를 보여주는 함수다. 보시다시피 선형 관계다. 이 자료도 병사수를 나타내는 y를 log화 하면 선형관계를 얻을 수 있다.선형관계가 된 나폴레옹 군 진격. 여기까지가 워밍업이었다. 이번에는 조금더 자세하고 구체적으로 살펴보자이 식을 이런 직선을 linear spline equation이라고 한다. 여기서 새로운 개념 knots가 .. 2025. 5. 5. 상관관계 1. 산포도와 상관관계여태 한 번에 변수 하나만 다루는 방법을 살펴봤다. 이제부터 변수 두 개의 상호관계를 분석하기 윈한 방법을 찾아본다. 남녀간의 관계처럼 많은 경우 둘간의 관계가 중요하다. 교육과 임금, 통화증가율과 물가 상승률, 학급 규모와 학교성적등.여기서는 교육과 임금 수준의 관계를 생각해보자.X축이 교육수준이고 Y축이 임금인 그래프가 있다고 치자. 전국민 무작위로 100명을 뽑아서 교육수준과 임금의 관계를 파악한다. 해당하는 구역에 점을 찍는다. 레고 회사의 지원을 받아 같은 점에 찍힌 구역은 레고로 쌓는다. 어떤 구역은 높고 다른 구역은 낮을 것이다. 우리는 이런 점을 공부한다. 이런 모양들을 정리해주는 보조적인 수치들이 필요하다. 앞으로 이런 수치들을 얻는 작업들을 하고 개 중 가장 기본.. 2025. 5. 1. 정규분포로의 근사 정규분포로 히스토그램을 근사1. 통계자료의 단위변환과 그 사례확률변수 x가 평균이 μ 분산이 σ^2인 정규분포를 따른다고 할 때 표준정규분포로 만드려면? 1. 먼저 X에서 평균 μ를 빼준다. (X - μ) 이것을 편차라고 한다.2. 그 다음 이 편차를 표준편차 σ로 나누어준다. 이렇게 만들어진 새로운 확률변수 Z는 표준정규분포를 따른다. 표준정규 분포는 평균이 0 분산이 1이다. 표준정규분포는 다음과 같은 특징을 같는다.하나, 분포의 전반적인 모습은 단위변환에 의해서 변하지 않는다.둘, 평균을 빼줬기 때문에 새로운 평균은 0이 된다.셋, 표준편차로 나눴기 때문에 새로운 편차는 1이 될 수 밖에 없다. 예시)예시를 들어보자 50점 만점 과목인 탐구에서 표준 점수가 60이면 상68%에 해당한다. 이 구간.. 2025. 5. 1. 이전 1 ··· 4 5 6 7 8 9 10 ··· 29 다음