본문 바로가기
728x90

k-최근접이웃알고리즘3

[ML] 붓꽃의 품종 분류(지도학습 / 분류) import numpy as np import pandas as pd import matplotlib.pyplot as plt - Data Collection from sklearn.datasets import load_iris iris_dataset = load_iris() iris_dataset.keys() # 데이터셋에 대한 설명 print(iris_dataset['DESCR'][:193]+'\n') # 예측하려는 붓꽃의 품종 이름 iris_dataset['target_names'] # 특성 # sepal은 꽃받침, petal은 꽃잎 iris_dataset['feature_names'] # 실제 데이터는 target과 data에 들어있음 # 샘플의 수 확인 iris_dataset['data'].sh.. 2021. 4. 29.
[ML] KNN - bmi model import pandas as pd import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier from sklearn import metrics from sklearn.metrics import classification_report # 한글폰트 설정 from matplotlib import font_manager, rc font_name = font_manager.FontProperties(fname='C:/Windows/Fonts/malgun.ttf').get_name() rc('font', family=font_name) - Data Collection bmi = pd.read_csv('./bmi_500.csv.. 2021. 4. 29.
[ML] KNN 알고리즘 - AND, XOR 연산 - scikit-learn 파이썬에서 쉽게 사용할 수 있는 머신러닝 프레임 워크, 라이브러리 회귀, 분류, 군집, 차원축소, 특성공학, 전처리, 교차검증, 파이프라인 등 머신러닝에 필요한 기능을 갖춤 학습을 위한 샘플 데이터 제공 - KNN(K-Nearest Neighbors, k-최근접 이웃 알고리즘) 새로운 데이터 포인트와 가장 가까운 훈련 데이터셋의 데이터 포인트를 찾아 예측 이웃이 적을 수록 모델의 복잡도 상승 → 과대적합 이웃이 전체 데이터의 개수와 같아지면 항상 가장 많은 클래스로 예측 → 과소적합 k값에 따라 가까운 이웃의 수가 결정 분류와 회귀에 모두 사용 가능(지도학습) 결정경계(Decision Boundary) : 클래스 분류하는 경계 데이터 포인트(sample) 사이 거리 값 측정 방.. 2021. 4. 29.
728x90