데이터분석/Machine Learning

데이터 마이닝 분석 패키지 Weka 이용

늘근이 2016. 2. 10. 14:10

설치 링크

http://www.cs.waikato.ac.nz/ml/weka/downloading.html


와이까또(?) 교수님이 만든 깔끔한 데이터 분석 툴

라이센스는 GNU라 응용하기는 어려울듯 하다. 다만 파이썬이나 R등을 이용해서 콘솔형식으로 데이터를 분석하는 것보다는 조금 더 그래픽적으로 편해서 쓸만하게 보인다. 자바 기반.

 


Explorer - 특정 데이터 집합에 대해 다양한 알고리즘을 활용, 데이터를 분석 

Experiomenter - 알고리즘 비교 환경

KnowledgeFlow - Explorer와 다를건 없고, 드래그앤드롭 방식

Simple CLI - 콘솔로 조작하는 메뉴.


파일실행

Explorer - Open file.. 버튼으로 프로그램을 실행시킬 수 있다.

기본적인 iris 데이터는 아래와같은 프로그램 설치 경로 안에 있다.




ARFF 이 파일을 까보면 구조는 대충 다음과 같다. 이 프로그램에서 뿐만 아니라 다른 프로그램에서도 응당 쓰이는 파일 형식이다.



@RELATION 은 이름 이라고 보면 되고

@ATTRIBUTE 는 데이터의 타입 속성을 정의한다.

@DATA 는 실제 데이터가 나열되어있는 공간이다.



Visualize All 버튼과 함께 아래와 같이 그래프를 띄워볼수 있다.



이 외에도, Classify 혹은 Cluster, Associate, 사용할수 있다.