Scikit-learn Knn사용법 / 정규화 및 기능 정리

데이터분석/Machine Learning

Scikit-learn Knn사용법 / 정규화 및 기능 정리

늘근이 2015. 11. 29. 20:17

데이터에 대한 교차검증

KNN

classifier.fit(매개변수)

classifier.predict(features[test])

를 이용하면 쉽게 Knn을 구현할수 있다. Knn은 최근접 이웃분류로써, 훈련데이터에서 가장 가까운 예제를 사려보고 그 라벨을 반환한다.

from sklearn.neighbors import KNeighborsClassifier
from sklearn.cross_validation import KFold

classifier = KNeighborsClassifier(n_neighbors = 1)

# 데이터에 대한 교차검증
kf = KFold(len(features), n_folds=5, shuffle=True)

means = []
for train, test in kf :
classifier.fit(features[train], labels[train])
prediction = classifier.predict(features[test])

curmean = np.mean(prediction == labels[test])
means.append(curmean)

print("accuracy : {:.1%}".format(np.mean(means)))

정규화

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import Standard Scaler

classifier = KNeighborsClassifier(n_neighbors = 1)
classifier = Pipeline([('norm', StandardScaler()), ('knn',classifier)])

저작자표시 비영리 변경금지 (새창열림)

'데이터분석 > Machine Learning' 카테고리의 다른 글

TF-IDF(Term Frequency - Inverse Document Frequency) (0)	2015.12.03
정리해야할것 + 참고할만한 책 (0)	2015.12.02
R과 이진트리를 이용한 데이터의 분류분석 및 훈련 (0)	2015.11.23
여러가지 분석모형 (0)	2015.11.18
[링크] 머신러닝관련 Deloitte 강의 (0)	2015.11.08

현재글Scikit-learn Knn사용법 / 정규화 및 기능 정리

옛날 블로그

늘

수식, 머신러닝, 교사학습, decorator, 이미지변환, 센차터치, 비지도학습, 트리구조, 디자인 패턴, 선형대수, 디자인패턴, 데이터마이닝, 자바, 장식 패턴, composite 패턴, 스칼라, 2017 티스토리 결산, 팩토리 디자인, 비용함수, 지도학습,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

옛날 블로그

Scikit-learn Knn사용법 / 정규화 및 기능 정리

'데이터분석 > Machine Learning' 카테고리의 다른 글

'데이터분석/Machine Learning'의 다른글

티스토리툴바

Scikit-learn Knn사용법 / 정규화 및 기능 정리

'데이터분석 > Machine Learning' 카테고리의 다른 글

'데이터분석/Machine Learning'의 다른글

관련글

티스토리툴바