전체 글161 코호트란? (Cohort) 코호트(Cohort)는 공통된 특성이나 경험을 공유하는 사람들의 그룹을 말한다.일반적인 코호트의 의미같은 시기에 태어난 사람들 (예 : 1990년생 코호트)같은 시기에 입학한 학생들 (예 : 2020년 입학 코호트)같은 시기에 특정 경험을 한 사람들비즈니스/마테팅에서의 코호트같은 시기에 첫 구매(또는 서비스 가입)을 한 고객 그룹을 말한다. 예시:1월 코호트 : 1월에 첫 구매한 고객들2월 코호트 : 2월에 첫 구매한 고객들3월 코호트 : 3월에 첫 구매한 고객들왜 코호트로 나눌 까?시간에 따른 고객 행동 패턴을 분석하기 위해서예를 들어 :1월에 첫 구매한 고객들이 2월, 3월, 4월에 재구해하는 비율은?어느 달에 가입한 고객들의 재구매율이 가장 높은가?시간이 지날수록 고객들의 구매 패턴은 어떻게 변하.. 2025. 7. 2. 펭귄 날개와 몸무게의 상관 계수 Palmer Penguins 데이터베이스는 펭귄의 서식지, 종, 부리 길이 등 펭귄 연구 데이터를 담고 있습니다.펭귄은 일반적으로 날개 길이가 길 수록 큰 펭귄이기 때문에 몸무게도 늘어납니다. 따라서 날개 길이와 몸무게 사이에는 양의 상관 관계가 있습니다. 다만, 펭귄 종에 따라 상관 관계의 정도가 다릅니다. 이를 확인하기 위해 날개 길이와 몸무게의 피어슨 상관 계수(Pearson Correlation Coefficient)를 구하는 쿼리를 작성해주세요.쿼리 결과에는 아래 컬럼이 포함되어 있어야 하고, 상관 계수는 소수점 아래 넷째 자리에서 반올림 해 셋째 자리까지 출력되어야 합니다.SELECT species, ROUND (SUM((flipper_length_mm - avg_flipper) * .. 2025. 7. 2. ROWS와 RANGE() ROWS는 물리적 행의 순서를 기준으로 윈도우를 정의 한다. RANGE는 정렬 기준 값이 같은 행들을 하나의 그룹으로 취금해서 계산한다. 쉽게 말하면 한 줄 씩 차례대로 계산하고 RANGE는 같은 값 끼리 묶어서 계산한다.예시다음과 같은 테이블이 있다고 생각해보자.-- 학생 성적 테이블student_name | exam_date | score김철수 | 2024-03-01 | 85이영희 | 2024-03-01 | 85 박민수 | 2024-03-02 | 90최지영 | 2024-03-03 | 78 ROWS 사용시SELECT student_name, exam_date, score, AVG(score) OVER ( ORDER BY exam.. 2025. 7. 1. 전력 소비량 이동 평균 구하기 Power Consumption of Tetouan City 데이터베이스는 모로코 북부 도시 중 하나인 테투안 지역의 전력 소비량과 기상 관측치가 들어있는 데이터베이스 입니다. 테투안 지역에는 Quads, Smir, Boussafou 총 3개 지역에 발전소가 있으며 해당 발전소로 부터의 전력 소비량이 각각 측정되어 있습니다. 전력 소비량 측정은 매 10분마다 시작해 10분간 진행하는 방식이고, measured_at 컬럼에 측정 시작 시각이 기록되어 있습니다. 전력 소비량은 순간순간 크게 변화하는 값이기에 트렌드를 보거나 수요 예측을 하기 위해서 단순 이동 평균을 자주 사용 합니다.2017년 1월 1일 0시부터 2017년 2월 1일 0시까지 10분 단위로 3개 발전소 전력 소비량의 1시간 범위 단순 이동 .. 2025. 7. 1. 윈도우함수 잘 쓰기 각 파티션 내에 비교할 수 있는 여러 행이 있어야 한다. PARTITION BY 와 GROUP BY가 완전히 같으면 각 파티션에 1개 행만 남는다.모든 rank가 1이 되서 무의미 하다. 예를 들면 SELECT developer, platform, SUM(sales) as total_sales, RANK() OVER (PARTITION BY developer ORDER BY SUM(sales) DESC) as platform_rankFROM games GROUP BY developer, platform; -- platform 추가 그룹바이에 여러행이 있어야 순위 매기기가 수월하다.| developer | platform | total_sales | platform_rank ||.. 2025. 6. 27. 게임 개발사의 주력 플랫폼 찾기 문제Video Game Sales with Ratings 데이터베이스는 1980년부터 2016년까지 출시된 게임들의 다양한 정보가 포함되어 있습니다. 포함된 정보에는 게임 개발사 정보와 각 게임의 플랫폼, 게임의 판매량 정보도 있습니다. 게임 분야에는 많은 플랫폼이 있기 때문에 하나의 개발사가 모든 플랫폼에 게임을 출시하는 것은 생각보다 어려운 일 입니다. 각 게임 개발사는 주력 플랫폼을 정해두고 해당 플랫폼 위주로 게임을 출시합니다. 따라서, 개발사마다 주력 플랫폼은 보통 판매량이 가장 많은 플랫폼으로 생각할 수 있습니다.games 테이블, companies 테이블, platforms 테이블을 조회해 각 게임 개발사의 주력 플랫폼과 해당 플랫폼의 판매량 합계를 집계하는 쿼리를 작성해주세요. 쿼리 결과에.. 2025. 6. 27. 이전 1 2 3 4 ··· 27 다음