본문 바로가기

데이브리/머신러닝3

XGBoost와 하이퍼파라미터 XGBoost 하이퍼파라미터 쉽게 이해하기XGBoost는 강력한 머신러닝 알고리즘이지만, 많은 하이퍼파라미터 때문에 초보자에게는 복잡해 보일 수 있습니다. 주요 하이퍼파라미터를 쉽게 설명해드리겠습니다.learning_rate (학습률)쉬운 설명: 새로운 트리가 만들어질 때마다 이전 트리의 결과를 얼마나 반영할지 결정하는 값입니다.낮은 값(0.01): 이전 트리의 결과를 조금만 반영하므로 학습이 천천히 진행됩니다. 과적합 위험이 줄어들지만 더 많은 트리가 필요합니다.높은 값(0.2): 이전 트리의 결과를 많이 반영하므로 학습이 빠르게 진행됩니다. 과적합 위험이 있지만 더 적은 트리가 필요합니다.비유: 등산을 할 때 큰 걸음으로 빨리 올라가면(높은 learning_rate) 정상에 빨리 도달할 수 있지만 길.. 2025. 4. 16.
균일 분포와 균등 분포 그리고 RandomizedSearch 균일 분포와 균등 분포는 본질적으로 같은 개념을 가리키는 용어입니다. 두 용어 모두 확률론과 통계학에서 사용되는 분포로, 특정 범위 내의 모든 값이 동일한 확률을 가지는 분포를 의미합니다.균일 분포/균등 분포(Uniform Distribution)기본 개념주어진 범위 내에서 모든 값이 발생할 확률이 동일한 분포주사위를 던지거나 카드를 뽑는 등의 상황에서 볼 수 있는 분포수학적으로는 모든 값에 대해 확률 밀도 함수(PDF)가 일정한 값을 가짐종류이산 균일 분포(Discrete Uniform Distribution)유한한 개수의 값들이 동일한 확률을 가짐예: 주사위를 던질 때 1부터 6까지의 숫자가 나올 확률은 모두 1/6로 동일연속 균일 분포(Continuous Uniform Distribution)연속적.. 2025. 4. 15.
저작권 문제로 혼자 개인적으로 정리하는 용도로 쓰지 자료는 공개하지 않겠습니다. 이런 누추한 블로그에 누가 오겠냐만 여기는 강의를 듣고 정리하는 카테고리 입니다. 저작권 문제로 비공개 처리 합니다. 어짜피 제가 보려고 만듭니다. 2025. 3. 12.