데이터분석 167

IBM Watson 이용해보기

왓슨이라는 놈을 들어보았나. 이 놈은 인공지능에 있어서 랜드마크와 같은 놈으로 '백만장자되기' 프로그램에 나와 쟁쟁한 사람들과 경쟁해서 이겼다고 한다. (오프라인으로..) 왓슨을 통해서 갖가지 정형화된 작업뿐만 아니라 인간의 질문에도 대답할수 있도록 비정형화된 데이터도 잘 처리한다고 한다. 위와같은 크고 아름다운 형체를 뽐내고 있으며 조명은 덤이다. 어마어마한 사용료를 내고 사용해봐야할것 같지만, 이러한 무지막지한 개인이 일단 공짜로 이용해 볼수 있다니, 클라우드 & 빅데이터와 인공지능 분야에서 우선순위를 점하려는 통근 전통 대기업들의 싸움이 볼만한 듯 하다. https://watson.analytics.ibmcloud.com/ 저번에 소개한 마이크로스프트의 Azure의 경우도 개인에게 200$ 어치의 ..

Microsoft Azure 를 이용한 신박한 머신러닝

https://azure.microsoft.com/ko-kr/services/machine-learning/ 이 신박한 물건은, 마이크로소프트 클라우드 솔루션인 Azure기반으로 돌아가는 툴이다. 주말에 해보면서 충격을 받았다. 이렇게 쉽게 할수있는것이라니. 아무래도, 우리나라 SI는 아직까지 B2B만을 고집하여야 하는 필수적인 이유가 여기있는것일지도 모른다는 생각이 들었다. 이런 쌈박한 물건을 만들어내지 못하기 때문에.보통 머신러닝을 생각하면 검은 화면에 빽빽한 코딩, 그리고 파이썬인지 R인지 MATLAB인지 뭔가 정신없는 것들을 막 쓰고 결과물도 거지같이 복잡하게 나오는것을 생각할지도 모른다.이 마이크로소프트에서 제공하는 쌈박함은 정말.. 어디서든 쉽게 따라올수 없는 내공이 돋보인다. 위와 같이 필요..

Support Vector Machines (SVM)

위의 그래프는 위키피디아에서 하나의 예이며, 검은돌과 흰돌을 구별해야하한다. 검은돌과 흰돌을 구별하는것은 그다지 어렵지 않고, 저 사이 어딘가에다가 줄을 그어야 하는데, 어떤 것이 제일 그럴듯해 보이는가? 일단 H3 은 틀린 구분선이며, H1은 잘 구분하고 있기는 하지만 무언가 좀 이상하게 구분되어있다. 제대로된 구분선은 H2로 보이지 않는가? 흰돌과 검은돌간 비슷비슷한 간격을 보여주고 있으면서 뭔가 H1보다는 타당성 있어 보인다. 이를 잘 살펴보면, H2 는 검은 돌 또는 흰돌과의 간격이 모두 멀리 떨어진 상태라는 것을 알수 있다. SVM알고리즘은 이렇게 공간상에 있는 여러가지 놈들은 제대로 구분짓기 위해서 선(혹은 초평면)을 잘긋는 알고리즘이다. 다만 잘 그리기 위해서는, 아래와 같이 간격 (Marg..

[개념] 가우시안 분포 (Gaussian Distribution)

가우시안 분포 (Gaussian Distribution)은 무엇인가? 그냥 정규분포 (Normal Distribution) 이다. 같은 맥락에서, 자연에 존재하는 노이즈가 있다. 마치 카메라로 사진을 찍으면 자연스러운 노이즈가 사진에 묻어나오걸 일종의 가우시안 노이즈 (Gaussian Noise) 라고 하는데, 다음의 확률분포곡선 (probability Density Function (PDF)) 을 참조한다.

② 파이썬 - 컴퓨터 비전 프로그래밍 (Local Image Descriptor) (2)

SIFT (Scale-Invariant Feature Transform)SIFT는 상당히 인기가 많은 인식방법 중 하나인듯하다.특징점 주변 픽셀들의 gradient 방향, 크기에 대한 히스토그램을 이용해 주변의 분포특성을 표현해 준다. 일단은 기하학적 특징보다는 어쨌든간 방향과 크기에 대한 아래와 같은 변화를 감지하여 인식하는 싱기방기한 인식방법이다. 출처 : https://commons.wikimedia.org/wiki/File:SIFT_gradient_magnitude_and_orientation_computation.svg참조 : https://en.wikipedia.org/wiki/Scale-invariant_feature_transform https://gilscvblog.wordpress.co..

② 파이썬 - 컴퓨터 비전 프로그래밍 (Local Image Descriptor) (1)

본 글은 Programming Computer Vision with Python (Jan Erik Solem) 을 그대로 따라간거임. 코너검출코너검출은 이미지의 특징점을 잡아내는데 있어 대표적인 방법이다. 물론 사진의 코너만 검출하고 거기서 끝이나면 그만큼 허무한것도 없겠지만, 코너를 잡아내어 이미지를 비교하거나 얼굴등의 윤곽선을 잡아낼수 있다. 뭐 이런느낌 아닐까? 출처 : http://www.learncomputervision.com/articles/programming/opencv-corner-detection-with-c/ 원리는 간단하다. 어떤 한 지점에서 동서남북으로 픽셀을 검사해봤을때 1) 변화가 있으면 코너이고, 2) 변화가 있기는 한데 같은 방향에서의 변화가 없으면 코너는 아니고 그냥 경..