통계학/경제통계학 1부 : 그림과 수치를 이용한 자료의 정리5 3 - 3. 혼돈요인 통제 : 따로따로 분석하기 복습: 실험자료가 아닌 경험자료로 분석하면 뭔가가 잠복해 있다. 이것을을 통제하지 못해 잠복요인에 공통으로 영향을 받는 x와 y 관계가 왜곡돼서 나타날 수 있다. 예제. 학과 난이도를 고려하지 않은 버클리 대학 남져 지원 비율,이처첨 변수는 통계를 조작하기 십상이다. 하지만 변수는 죄가 없다. 변수를 고려못한 인간의 실책만 있을 뿐. 혼동요인으로 인한 결과의 왜곡을 막으려면 이에 대한 통제가 필요하다. 어떻게 통제하지?따로로따로. 교수님은 이 말을 강조했고 앞으로도 강조 한다 했다. 자료를 혼동요인에 따라 세부집단으로 분류하고 세부집단 별로 따로따로 분석한다. 세부집단이 많을 경우에 회귀분석을 이용한다.예시) 경구 피임약의 복용이 해당 여성의 혈압을 높이는가?- 연령이 혼동 요인으로 작용 : 연령이 높으.. 2025. 4. 24. 3 - 2. 히스토그램 그리기 자료를 범위로 나눠서 개수를 세고 그것을 비율로 바꿔서 표현할 수 있다. 이것이 히스토그램을 그리는 방법이다. 아래 표를 보자.대한민국 근로자 가구의 월 소득 분포를 나타낸 표이다. 아래보는 그림은 잘못된 표다. 세로축과 가로축을 보자. 세로축은 비율, 가로축은 소득을 나타낸다. 아마추어가 봐도 이 그림은 잘못됐다. 뭐가 문제 일까? 세로축이 잘못됐다. 세로축을 비율로하니 너무 커진다. 소득이 600만원 이상인 경우는 많이 없기에 모두 묶어줬다. 비율로 높이를 삼으니 블록의 면적이 확 커진다는 걸 알 수 있다. 이번에는 아래 그림을 보자. 이 그림은 잘 나타낸 그림이다. 우선 계급구간별로 비율을 폭으로 나누어 해당 블록의 높이로 삼는다. 블록 면적이 해당 계급구간에 속한 자료의 비율을 나타낸다. 이 그림.. 2025. 4. 24. 3 - 1 그림을 이용한 자료정리 데이터 분석에서 시각화는 필수요건. 아래는 베이브 루스의 연도별 홈런수를 보여준다. 25시즌은 베이브 루스가 부상으로 큰 큰 활약을 보이지 못했다. 그나마도 20개가 넘는 홈런이니 정말 뛰어난 선수다. 이런 그림을 보면 가로축이 뭔가 세로축이 뭔지 파악하자. 가로축은 시즌이고 세로축은 홈런 수 이다. 아래 그림을 시계열 그림이다. 그림에서 홈런 40-50개 사이에 특별한 표시를 했다. 베이브루스는 7시즌을 40개가 넘는 홈런을 쳤다. 즉 베이브루스는 홈런을 40개 넘게 치는 선수라고 볼수있다. 그림을 다르게 표현 할 수도 있다. 세로축 구간별로 자료의 개수를 세면 다음과 같이 표현할 수 있다. 아래 그림을 줄기-잎 그림이라고 한다. 줄기는 10의 자리수를 나타내고 잎은 1의 자리수를 나타난다. 이런 그림.. 2025. 4. 24. 종적 자료의 척도와 정리 변수의 종류에는 무엇이 있을까?양적 변수 : 나이, 가족의 수, 가구소득질적 변수 : 혼인상태, 취업여부 -> 일반적으로 질적 변수도 통계처리 목적상 수치로 코딩하여 사용한다.이상변수 : 가족 수 처럼 2,3,4 등의 이산적인 값만을 취함.연속변수 : 나이, 가구소득처럼 연속인 값을 취한다.컴퓨터를 통해 숫자를 표현하면 이론상 이는 언제나 이산적일 수밖에 없다.현실적으로는 어떠한 연속변수도 이산적으로 근사 시켜 표현할 수밖에 없다.이때 그 근사의 정확도를 얼마로 할 것인가가 문제의 본질이다.척도의 종류명목척도 - 척도의 명칭만 의미 있다.예시) 결혼 상태에 대한 코드 : { 미혼 = 1, 기혼 = 2, 이혼 = 3, 사별 = 4}순서척도 - 명칭 및 순서가 의미를 지닌다예시) 성적 등급 - {poor =.. 2025. 4. 23. 통계란 무엇인가? 왜 통계학을 배워야 하나통계학은 크게 두 가지로 분류할 수 있다.기술통계학(descriptive statistics)자료를 변수 별로 따로따로 또는 관계되는 변수끼리 묶어서 요약.추론통계학정리된 자료에 담긴 의미를 해석하여 미지 세계에 대해 추론한다.모집단과 표본 사이의 관계2) 자료의 종류횡단면 자료한 시점에서 여러 개체를 관측한 자료.특정 날짜에 서울시 25개 구의 미세먼지 농도 측정 데이터2025년 4월 기준 KOSPI 상장 기업 100개의 주가 및 재무 데이터전국 대학생 1,000명을 대상으로 한 취업 선호도 설문조사 결과특정 시점에 수집된 20개국의 GDP, 실업률, 물가상승률 데이터시계열 자료한 개체를 여러 시점에 걸쳐 관측한 자료2015년부터 2025년까지 삼성전자의 분기별 매출액 변화최근 .. 2025. 4. 23. 이전 1 다음