728x90 지니불순도1 [ML] 머신러닝 모델(결정 트리 학습, K-근접 이웃) - 결정 트리 학습(Decision tree) 결과에 대한 설명이 중요할 때 사용 훈련 데이터에 있는 변수, 즉 특성을 기반으로 새로운 샘플의 클래스 레이블을 추정할 수 있도록 일련의 질문 학습 범주형 변수, 실수형 변수 트리의 루트(root)에서부터 시작해 정보 이득(Information Gain, IG)이란 값이 최대가 되는 특성으로 데이터를 나눔 위의 과정을 리프 노드(leaf node)가 순수해질 때까지(불순도가 0에 수렴할 때 까지, 하나의 클래스만을 가진 노드가 될 때까지) 모든 자식 노드에서 분할 작업 반복 분할 작업을 계속 반복하여 깊은 트리가 만들어지는데, 이는 과적합 우려 → 트리 최대의 깊이 제한(트리 가지치기 - pruning) 목적함수의 목적 : 가장 정보가 풍부한 특성으로 노드를.. 2021. 5. 11. 이전 1 다음 728x90