분류 전체보기 850

데이터 분석 전문가/준전문가

이책은 ADsP / ADP를 보기위한 책이다. 그렇지만 이론을 공부하기에는 좀 벅차다. 애초에 데이터분석에 있어서 좀 제대로 공부할수 있는 책이 드물기는 하지만 이책은 너무 오직 ADsP를 따기위한 지름길을 너무 찾아가기만 하고 이해로써는 조금 부족한듯 하다. 나온지 얼마 안되는 시험이라 누가 볼지는 모르겠지만 어쨌든 ADsP를 따기위해서 참고는 잘되는 책인듯하다. 대부분은 R을 이용해서 데이터를 다루는 방법에 대해 많은 분량을 소개하고 있다. 다만 교재의 한계점이 보이는게 스토리텔링은 부족한듯 싶다. 통계학에 대한 전반적인 지식이 있으면 그냥가서 봐도 붙을수도 있다고 생각한다.

IT 서평 2015.11.26

R과 이진트리를 이용한 데이터의 분류분석 및 훈련

데이터는 훈련과 예측이다. 머신러닝도 마찬가지이다. 무슨 이야기인고 하니, 어느 데이터가 있으면 그걸로 패턴을 분석하여 어떤식의 상관관계가 있는 지 알아볼수 있다는 것이다. 정형 데이터를 마이닝하는데 있어 제일 많이 쓰이는 분류분석(Classification)에서는 트리형식으로 데이터를 분류한다. 위와같은 그래프는 눈에 익지는 않겠지만 실제로 어떤 값을 가졌을때 구분이 어떻게 되어야 하는지 표현한 표와 같다. 예를들어 특정한값이 1.57 이하면 2번으로 가고 초과를 한다면 5번으로가서 최종적으로는 여러 인자를 통해 최종적인 노드를 결정하게 된다. 자 각설하고 한가지씩 따라해본다. 일단 HDclassif라는 라이브러리를 로딩해본다. > library(HDclassif) 이 라이브러리에는 wine이라는 데이..

여러가지 분석모형

회귀분석 다중회귀 분석 : 독립변수가 2개 이상인 경우 (중회귀모형) 다중공선성(Multicollinearity) : 설명변수들 사이에 선형관계가 존재하면 분석 어려움 다항회귀분석 : 독립변수와 종속변수 간에 곡선관계가 있는 경우 곡선회귀분석 : 독립변수, 종속변수 1개일 때 2차이상의 비선형함수 비선형회귀분석 : 종속 / 설명변수간 관계가 비선형일때 회귀모형의 선택지표 결정계수, 수정결정계수, Mallow' Cp, Akaike's Information Criterion) 변수선택방법 전진선택법, 후진제거법, 단계별 방법 시계열 분석 정상성(stationarity) 모든 시점에 대해 일정한 평균. 이동평균 (Moving Average Model) 자기회귀누적이동평균 (ARIMA모형, autoregress..

R을 이용한 그래프 시각화 명령어

시각화를 하기 위해 다음과 같은 라이브러리와 데이터를 로딩한다.> library(MASS) > data(survey) 그리고 데이터를 조회해본다.> table(survey$Smoke) Heavy Never Occas Regul 11 189 19 17 파이차트 그리기> smoke pie(smoke) 바차트> barplot(smoke) 히스토그램> data(mtcars)> hist(mtcars$mpg) 줄기 잎 그림> stem(mtcars$mpg) The decimal point is at the | 10 | 44 12 | 3 14 | 3702258 16 | 438 18 | 17227 20 | 00445 22 | 88 24 | 4 26 | 03 28 | 30 | 44 32 | 49 선그래프> install...

R의 기본 통계 기능

아래의 내용은 '데이터 분석 전문가/준전문가' 라는 책에 있는 내용을 따라서 해본것이며, 나름 재미있다. 교과서 답지않게 딱딱하지도 않고 내공이 돋보인다. 사 보도록 한다. 모수적 통계분석 기법개요 빈도분석 / 상관분석 / 표본평균검증 / 세집단 이상의 평균검정 / 회귀분석 비모수적 통계분석 기법개요 적합도 검정 / 변수간 상관분석 표본추출 단순랜덤샘플링 계통샘플링 : 임의 위치에서 매 k번째 항목 추출 층화샘플링 : 명확하게 다른 데이터를 중첩없이 분할하여 샘플링 집락추출 : 군집을 구분하고 군집별로 단순랜덤샘플링한 후 모든자료를 활용 추출 명령어 비복원추출sample(1:100,5) 복원추출(한번뽑은걸 다시뽑음) sample(1:100,5,replace=TRUE) 가중치부여sample(1:100, 5..

[링크] 개발자를 위한 SAP HANA 무료이용

https://account.hanatrial.ondemand.com/ 여기가서 등록하고 쓴다. https://help.hana.ondemand.com/help/ 여기서 도움말을 얻는다. 들어가보면, https://tools.hana.ondemand.com/mars 위의 주소로 install new Software를 설치할수있다. 콕핏에서 인스턴스를 신청할수 있는데, 위와같이 trial instance를 신청할수 있다. 그리고 아래와같이 접속하면 준비완료다. 만약 trial instance 가 신청이 되지 않았으면 제대로된 스키마를 찾을수 없다고 한다. 이제 XS프로젝트를 만들려면 아래와 같은 절차로 해볼수있다 http://scn.sap.com/community/developer-center/cloud-..

도메인/ERP 2015.11.15