앞으로 쓸 포스팅은 Coursera 설립자인 Andrew Ng(응가 아니고 응) 선생님의 강의를 바탕으로 요약식으로 재구성한것으로, Coursera나 Itunes에서 공짜로 냅다 들을수 있다. 포스팅은 간단한 데이터 분류에서부터 기계학습, 이미지 프로세싱, 영상처리까지 구성할 예정이며 나중에 자료를 집대성해서 일반인들이 쉽게 이해할수 있는 자료집을 만들어도 좋겠다는 생각이다.

머신러닝이라함은 사실은 그냥 들을때는 굉장히 멋있어 보이고 어려워보이기만 한다. 그렇지만 막상 까보면 이전에 있었던 개념이며 이러한 개념들이 현재 이슈되고있는 빅데이터 등의 개념과 합쳐져서 대두가 되고있는 느낌이다. 머신러닝은 결국에는 데이터를 다루는것에 대한 하나의 이론이며 이의 패턴을 찾아 예측하는 방법론이라고 할수 있을것이다.

결국 머신러닝은 데이터가 기반이 되는 영역이며, 요새들어 뜬 빅데이터와 긴밀한 연관이 있다. 일반 비전공자가 접근하기는 힘든 내용이지만, 뜻이 있는곳에 길이 있나니 일단은 감자칩과 맥주를 들이키면서 포스팅을 해보겠다.

국내에는 그 유명세에 비해 접근할수 있는 자료가 그렇게 많지 않은것으로 보인다. 실제로 구글에 한번 쳐보면 역시나..조대협님의 블로그가 먼저 뜬다. 항상 열심히 새로운 개념을 정리해주시는 분이지만 기계학습은 워낙 어려운 분야였던지 끝을 내지 못하셨다. 이에 내가 한번 먹어보겠습니다 라는 마음가짐으로 한번 도전해본다.

권위자에 기대어 포스팅에 힘을 실어주기 위해 구입하거나 준비해놓은 준비물을 주섬주섬 꺼내본다.

 

준비된 머신러닝 관련 참고자료는 다음과 같다.

- Andrew Ng, Coursera 강의에서 발췌 ( https://www.coursera.org/learn/machine-learning/home )

- 한학용 저, 패턴인식 개론, 한빛아카데미

- Galit Shmueli, Nitin R,. Patel, Peter C. Bruce , Data Mining for Business Intelligence.wiley

- Peter Harrington, Machine Learning in action, Manning

- Jan Erik Solem, Programming Computer Vision with Python


기타 참고할 자료는 다음과 같다.

- Wes Mckinney, Python for Data Analysis, O'REILLY

- Eli Bressert, SciPy and NumPy, O'REILLY

기타 matlab관련 서적 (구입전)


주로 다룰 툴은 다음과 같다.

- Python (Numpy, SciPy, Scipy-Image, Scipy-Learning)

- Scala (Apache Spark 관련 머신러닝 라이브러리)

- D3.js 등 자바스크립트 시각화 관련 툴 (tableau등 고려)

 

마지막으로 참고해볼만한 블로그

다크프로그래머 http://darkpgmr.tistory.com/ 

 

현재 기계학습을 주로 다루는 분야는 학술분야이기 때문에 MATLAB이 가장 많이 쓰이는것으로 보인다. 다만 파이썬이나 자바 스칼라(Apache Spark)에서도 충분히 지원이 될랑말랑 하는 추세이며 이와 관련된 API들이 향후 몇년간은 쏟아져 나올듯 하다.

사회학분야나 일반과학 뿐만아니라 금융공학, 로봇공학등에서도 무궁무진한 분야이므로, 어쨌든 미래먹거리든 개인적인 취미생활이든 제대로 파보고 끝마무리를 짓도록 한다.

블로그 이미지

고락가락

필요한것 이것저것 합니다.