본문 바로가기
728x90

군집분석2

[ML] 군집분석(계층 군집, 밀집도 기반 군집) - 계층 군집(Hierarchical clustering) 덴드로그램(Dendrogram)을 그릴 수 있음 의미 있는 분류 체계를 만들어줌 → 군집 결과 이해, 설명에 적합 클러스터의 수를 미리 정하지 않아도 됨 병합 계층 군집(Agglomerative hierarchical clustering) 클러스터 당 하나의 데이터에서 시작하여, 모든 데이터가 하나의 클러스터에 속할 때까지 가장 가까운 클러스터를 병합해 나감 단일 연결 클러스터 쌍에서 가장 비슷한, 즉 가장 가까운 데이터 간의 거리를 계산 거리의 값이 가장 작은 두 클러스터를 하나로 합침 완전 연결 클러스터 쌍에서 가장 비슷하지 않은, 즉 가장 멀리 있는 데이터를 찾아 거리를 계산 가장 가까운 두 클러스터를 합침 평균 연결 : 두 클러스터에 있는.. 2021. 5. 12.
[ML] 군집분석(K-means, K-means++) - 정답이 없는 문제를 해결하기 위한 알고리즘 → 비지도학습 '군집분석' - 군집분석(Clustering Analysis) ex) 쇼핑몰에서 페이지 체류 시간, 구매 금액대 등을 토대로 소비자 유형 그룹을 나누고(군집 설정), 새로운 소비자가 쇼핑몰에 들어왔을 때 행동을 바탕으로 앞서 설정해놓은 그룹으로 할당, 비슷한 소비자가 구매한 상품 노출하여 제품 구매율을 높힘 군집은 정답을 모르는 데이터 안에서 숨겨진 구조를 찾는 것 클래스 레이블이 없는 데이터를 특정 군집으로 묶고자 할 때 활용 계층 군집, 밀집도 기반 군집(클러스터 모양이 원형이 아닐 때 사용) - K-평균(K-means) 매우 쉬운 구현성, 높은 계산 효율성 → 학계와 산업현장을 가리지 않고 활약 프로토타입 기반 군집 : 각 클러스터가 하나.. 2021. 5. 11.
728x90