분류 전체보기147 언피펏(unpivot) 언피벗은 데이터 분석에서 많이 쓰이는 방식이다. 개념을 알기전 피벗이 뭔지 살펴보자피벗(pivot)의 개념 : 데이터를 가로로 펼치기피벗은 세로로 긴 데이터를 가로로 넓게 펼치는 작업이다. 학생들 월별 성적 데이터가 있다고 쳐보자. 피벗 전 데이터학생명 | 월 | 점수김철수 | 1월 | 85김철수 | 2월 | 90김철수 | 3월 | 88이영희 | 1월 | 92이영희 | 2월 | 87이영희 | 3월 | 95 피벗 후 데이터 학생명 | 1월점수 | 2월점수 | 3월점수김철수 | 85 | 90 | 88이영희 | 92 | 87 | 95 이렇게 피벗은 분석하기 편하게 데이터를 재배열 하는 것이다. 언피벗은 피벗의 정반대 개념이다. 가로로 넓게 펼쳐진 데이터를 세로로 길게.. 2025. 6. 19. 폐쇄할 따릉이 정류소 찾기 2 문제공유 자전거 서비스인 따릉이를 운영하는 팀에서는 지역별로 이용률이 감소하고 있는 따릉이 정류소를 폐쇄해 따릉이 서비스의 운영비용을 줄이려고 합니다. 따릉이 데이터를 다루는 당신은 정류소 정보가 담겨있는 station 테이블과 대여 기록이 담겨 있는 rental_history 테이블을 확인해 폐쇄를 검토할 따릉이 정류소 목록을 추려내는 업무를 받았습니다.폐쇄할 정류소를 검토하기 위해 2019년 10월 한 달 동안 정류소에서 발생한 대여/반납 건수가 2018년 10월 같은 정류소에서 발생한 대여/반납 건수의 50% 이하인 정류소를 출력하는 쿼리를 작성해주세요. 2018년 10월 또는 2019년 10월 한 달간 대여/반납 건수가 0건인 정류소는 이미 폐쇄된 정류소이거나 새로이 생긴 정류소 일 수 있으므로 .. 2025. 6. 19. 멘토링 짝꿍 리스트 https://solvesql.com/problems/mentor-mentee-list/ https://solvesql.com/problems/mentor-mentee-list/ solvesql.com문제employees 테이블에는 어느 회사의 직원 정보가 들어있습니다. 각각의 데이터는 직원 ID, 직원의 이름, 입사일, 부서, 직속 상사의 ID로 구성되어있습니다.회사에서 신규 입사자들의 빠른 적응을 돕기 위해 멘토링 프로그램을 운영하려고 합니다. 멘티가 될 신규 입사자들은 ‘2021년 12월 31일’을 기준으로 3개월 이내 입사한 인원 전체이며, 멘토는 ‘2021년 12월 31일’을 기준으로 재직한지 2년 이상이 된 직원들만 배정하려고 합니다. 또한 최대한 다양한 분야의 직원들이 서로 교류 할 수 있도.. 2025. 6. 16. 지역별 주문의 특징 문제US E-Commerce Records 2020 데이터베이스는 미국 이커머스 웹사이트의 판매 데이터를 담고 있습니다. records 테이블은 주문 번호, 주문 날짜, 주문 지역, 카테고리 등 주문의 상세 정보가 들어 있습니다. 이 데이터를 이용하여 미국의 각 지역별로 어떤 카테고리의 상품이 많이 판매되는지 알아보려고 합니다. region, category 별 주문량을 계산해 출력하는 쿼리를 작성해주세요. /SELECT region AS Region,COUNT(DISTINCT CASE WHEN category = "Furniture" THEN order_id ELSE NULL END) AS Furniture,COUNT(DISTINCT CASE WHEN category = "Office Supplies".. 2025. 6. 6. 백분율 계산 할때는 *100.0 하기 SQL에서 두 정수를 나누면 결과도 정수가 되어 소수점 이하는 버려집니다. 예를 들어:gift가 포함된 작품이 50개, 전체 작품이 1000개라면50 / 1000 = 0 (정수 나눗셈)문제 외부유출 되면 안된다고 하니... 이렇게 배운거라도 쓴다. 2025. 6. 2. 총변동의 분해 산점도 사지을 보자. 각 점은 특정 연도의 통화증가율(x축)과 인플레이션율(y축)을 나타낸다. 파란색 선은 이점들의 전반적인 추세를 보여주는 회귀선이다. 1993녀는 조금 특이하다. 이 해 통화증가ㅠㄹ은 17.54% 였고 인플레이션율은 6.35%. 회귀선보다 위에 있다는 것은 통화증가율만으로 예상되는 것보다 인플레이션이 더 높았다는 의미다. 다시 말해, 다른 요인들도 영향을 미쳤다. 총변동의 분해는 왜 중요할까?이제 통계적으로 왜 1993년 인플레이션이 평균보다 높았는지 에 대한 분석을 해보자.전체 기간의 평균 인플레이션은 4.5%이다. 1993년은 6.35%로 평균보다 1.85% 높다. 이 차이(1.85%)는 왜 발생할까?이 차이를 두 부분으로 나눈다. 1. 통화증가율로 설명되는 부분(R) : 회귀선 .. 2025. 5. 19. 이전 1 2 3 4 ··· 25 다음