통계학41 종적 자료의 척도와 정리 변수의 종류에는 무엇이 있을까?양적 변수 : 나이, 가족의 수, 가구소득질적 변수 : 혼인상태, 취업여부 -> 일반적으로 질적 변수도 통계처리 목적상 수치로 코딩하여 사용한다.이상변수 : 가족 수 처럼 2,3,4 등의 이산적인 값만을 취함.연속변수 : 나이, 가구소득처럼 연속인 값을 취한다.컴퓨터를 통해 숫자를 표현하면 이론상 이는 언제나 이산적일 수밖에 없다.현실적으로는 어떠한 연속변수도 이산적으로 근사 시켜 표현할 수밖에 없다.이때 그 근사의 정확도를 얼마로 할 것인가가 문제의 본질이다.척도의 종류명목척도 - 척도의 명칭만 의미 있다.예시) 결혼 상태에 대한 코드 : { 미혼 = 1, 기혼 = 2, 이혼 = 3, 사별 = 4}순서척도 - 명칭 및 순서가 의미를 지닌다예시) 성적 등급 - {poor =.. 2025. 4. 23. 통계란 무엇인가? 왜 통계학을 배워야 하나통계학은 크게 두 가지로 분류할 수 있다.기술통계학(descriptive statistics)자료를 변수 별로 따로따로 또는 관계되는 변수끼리 묶어서 요약.추론통계학정리된 자료에 담긴 의미를 해석하여 미지 세계에 대해 추론한다.모집단과 표본 사이의 관계2) 자료의 종류횡단면 자료한 시점에서 여러 개체를 관측한 자료.특정 날짜에 서울시 25개 구의 미세먼지 농도 측정 데이터2025년 4월 기준 KOSPI 상장 기업 100개의 주가 및 재무 데이터전국 대학생 1,000명을 대상으로 한 취업 선호도 설문조사 결과특정 시점에 수집된 20개국의 GDP, 실업률, 물가상승률 데이터시계열 자료한 개체를 여러 시점에 걸쳐 관측한 자료2015년부터 2025년까지 삼성전자의 분기별 매출액 변화최근 .. 2025. 4. 23. 21강 t분포로 구간추정 1. 가장 자연스러운 구간추정우리의 최종목표는 모집단이 정규분포라는 것만 알고 모분산은 모르는 경우, 소표본에서 모평균을 추정한다는 방법론이다. 이때 다음 방법으로 계산이 가능하다.T = (표본평균 - 모평균) / (표본표준편차) * 루트 (n - 1)이 통계량을 만들면, 완전하게 상대도수가 파악되는 분포인 t분포가 된다는 것을 앞 강의에서 설명했다. 이러면 95% 예언적중구간을 만들 수 있고, 이것을 이용해 검정이나 구간추정을 할 수 있게 된다.예를 들어 자유도가 10이면 자유도 10 부분 숫자 2.228을 선택한다. 그리고 95% 예언적중구간은 0을 축으로 한 대칭구간 -2.228 T는 모집단에 관한 정보를 모평균 μ만 포함하고 있지 않다. 그래서 표본을 구체적으로 얻은 것을 바탕으로 어떤 모평균 μ.. 2025. 3. 26. 20강 : t 분포 1. t분포앞 강의에서 나는 모분산으로 자연스러운 추정이 가능하다는 것을 알았다. 이것은 모집단이 정규분포 한다는 지식만 갖고서 모집단의 특성을 나타내는 중요한 모수인 모분산 σ^2을 추정하는 기술이 있다. 어떻게 해서 이런 일이 가능한지 다시 알아보자.정규모집단에서 데이터 n개를 x1, x2, ... xn을 구체적으로 관측했을때, 이 데이터들의 표본평균 x̄는 간단히 계산할 수 잇는 통계량이다. 그리고 n개의 편차 x1 - x̄, x2 - x̄, x3 - x̄ ... xn - x̄ 역시 구체적인 데이터만으로 계산할 수 있는 통계량이다.그런데 이러한 것을 제곱하고 모두 더한 것을 모분산 σ^2으로 나눈 W라는 통계량이 카이제곱분포라고 하는, 상대도수를 완전히 알고 있는 분포가 되었기 때문에 그 95% 예.. 2025. 3. 25. 19강 모평균이 미지인 정규모집단을 구간추정 1. 모평균을 몰라도 모분산을 추정앞 강의에서 표본분산 s^2과 비례하는 통계량 W가 카이제곱분포를 한다는 것을 알았다. 표본분산의 계산에는 모평균 μ를 사용하지 않는 대신에 표본평균 x̄를 사용하기 때문에 W의 분포를 사용하기 위해서는 모평균을 몰라도 상관없다. 이로써 바라던 추정 방법을 알 수 있게 되었다. 정규모집단에서 필요 없는 지식은 아무것도 가정하지 말고 추정한다. 오늘 공부 할 내용은 모평균도 모분산도 모르는 정규모집단에서 나온 표본에서 모분산을 추정한다는 구간추정 방법을 설명한다. 왜 모평균이 아닌 모분산을 추정하냐고 묻는 이를 위해 미리 답하겠다. 당신은 똑똑하다. 모평균이 기본적인 모수라 이것을 추정하는 게 효율적이라 할 수 있다. 아직은 나의 지식이 부족하다. 모평균을 추정하기 위해서.. 2025. 3. 21. 18강. 표본분산의 분포는 카이제곱 분포 1. 표본분산과 비례하는 통계량 W를 만드는 법앞 강의에서 정규모집단에서 관측된 표본에서 모평균 μ를 뺀 수를 모표준편차σ로 나누고, 이것을 제곱하고 모두 더하여 카이제곱분포를 따르는 통계량 V를 계산하고 이 분포의 95% 예언적중구간을 이용하여 구간추정을 했다. 참고로 여기서는 모평균 μ를 알고 있다는 조금 부자연스러운 가정으로 계산했다. 왜냐하면 데이터에서 모평균을 빼고, 모표준편차로 나눔으로써 표준정규분포를 하듯이 만들고, 이것을 제곱한 모든 것을 더한 것이 카이제곱분포가 되기 때문에 이러한 부자연스러운 지식이 필요했다.V를 만드는 공식은{(데이터) - (모평균 μ)} ^ 2인데 중괄호 안에 들어 있는 것이 (편차) ^ 2과 비슷하다.통계량 V는 모평균을 뺀다. 표본분산 s^2은 표본평균 x̄를 빼.. 2025. 3. 21. 이전 1 2 3 4 5 6 7 다음