소프트웨어 개발/Python

일반인을 위한 머신러닝(5) - 파이썬 다뤄보기

늘근이 2015. 8. 22. 19:29

본 내용은 http://scikit-learn.org/stable/tutorial/basic/tutorial.html 튜토리얼에 있는 내용을 축약하여 편집한 내용입니다.

 

지금까지 이론적인것들에 치중되어서 상당히 재미가 없었다.

 

머신러닝의 인기남 응ㄱ 선생님은 Octave를 쓰기를 권장하시나, 사실 전용툴인 Octave와 범용툴인 Python의 재미차이는 어마어마합니다. 파이썬의 경우 기본적인 윈도우 프로그래밍부터 학술용 프로그램, 웹단 프로그램 등 못하는게 없는데 MATLAB과 같은 전용툴만 쓸 경우 추후에 뭔가 기획하고 확장시킬때 굉장한 제약사항으로 다가오기 마련이기 때문입니다.

 

일단 무작정 한번 파이썬을 구동하여 설치해보기 시작합니다. 물론 파이썬 설치법을 자세히 써놓으면 방문자수가 많이 늘테지만 귀찮아서 하지 않겠습니다.

 

>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> digits = datasets.load_digits()

 

위의 iris는 도대체 무엇일까요?

 

 

 

포스팅에 존댓말을 쓰려니 이상해서 못쓰겠다.

 

구글이미지를 검색해보면 바로 꽃이라는걸 알수 있다. 비슷한 꽃이 많기 때문에 이를 정확히 분류해내는 샘플로써 일종의 머신러닝계의 '홍길동'이라고 볼수 있는것이다.

 

Scikit-learn 패키지에서는 내부적으로 이를 데이터로 변환한 데이터를 기본으로 제공하기 때문에, load_iris()로 로딩을 해왔다.

 

>>> print(digits.data) 

[[  0.   0.   5. ...,   0.   0.   0.]
[  0.   0.   0. ...,  10.   0.   0.]
[  0.   0.   0. ...,  16.   9.   0.]
...,
[  0.   0.   1. ...,   6.   0.   0.]
[  0.   0.   2. ...,  12.   0.   0.]
[ 0. 0. 10. ..., 12. 1. 0.]]

 

 

digits.data 속성은 digits 샘플데이터를 구분하기 위한 digit 샘플을 제공한다.

 

>>> digits.target
array([0, 1, 2, ..., 8, 9, 8])

 

 

 

 

 

 

 

 

 

'소프트웨어 개발 > Python' 카테고리의 다른 글

Numpy 및 Scipy 시작하기,  (0) 2015.11.28
pickle을 이용한 간단한 데이터 저장.  (0) 2015.10.03
django ajax  (0) 2015.04.27
Dajax를 이용해서 django 비동기통신  (0) 2015.04.27
Django 웹소켓, Redis 구축  (0) 2015.04.27