데이터분석 167

여러가지 분석모형

회귀분석 다중회귀 분석 : 독립변수가 2개 이상인 경우 (중회귀모형) 다중공선성(Multicollinearity) : 설명변수들 사이에 선형관계가 존재하면 분석 어려움 다항회귀분석 : 독립변수와 종속변수 간에 곡선관계가 있는 경우 곡선회귀분석 : 독립변수, 종속변수 1개일 때 2차이상의 비선형함수 비선형회귀분석 : 종속 / 설명변수간 관계가 비선형일때 회귀모형의 선택지표 결정계수, 수정결정계수, Mallow' Cp, Akaike's Information Criterion) 변수선택방법 전진선택법, 후진제거법, 단계별 방법 시계열 분석 정상성(stationarity) 모든 시점에 대해 일정한 평균. 이동평균 (Moving Average Model) 자기회귀누적이동평균 (ARIMA모형, autoregress..

R을 이용한 그래프 시각화 명령어

시각화를 하기 위해 다음과 같은 라이브러리와 데이터를 로딩한다.> library(MASS) > data(survey) 그리고 데이터를 조회해본다.> table(survey$Smoke) Heavy Never Occas Regul 11 189 19 17 파이차트 그리기> smoke pie(smoke) 바차트> barplot(smoke) 히스토그램> data(mtcars)> hist(mtcars$mpg) 줄기 잎 그림> stem(mtcars$mpg) The decimal point is at the | 10 | 44 12 | 3 14 | 3702258 16 | 438 18 | 17227 20 | 00445 22 | 88 24 | 4 26 | 03 28 | 30 | 44 32 | 49 선그래프> install...

R의 기본 통계 기능

아래의 내용은 '데이터 분석 전문가/준전문가' 라는 책에 있는 내용을 따라서 해본것이며, 나름 재미있다. 교과서 답지않게 딱딱하지도 않고 내공이 돋보인다. 사 보도록 한다. 모수적 통계분석 기법개요 빈도분석 / 상관분석 / 표본평균검증 / 세집단 이상의 평균검정 / 회귀분석 비모수적 통계분석 기법개요 적합도 검정 / 변수간 상관분석 표본추출 단순랜덤샘플링 계통샘플링 : 임의 위치에서 매 k번째 항목 추출 층화샘플링 : 명확하게 다른 데이터를 중첩없이 분할하여 샘플링 집락추출 : 군집을 구분하고 군집별로 단순랜덤샘플링한 후 모든자료를 활용 추출 명령어 비복원추출sample(1:100,5) 복원추출(한번뽑은걸 다시뽑음) sample(1:100,5,replace=TRUE) 가중치부여sample(1:100, 5..

기계학습, HAAR 훈련을 통한 캐릭터 파인더

사람얼굴 검출기는 시중에 너무 좋은것들이 많이 풀려있다. 그건 페이스북에 문의하도록 한다. 여기서는 사람이 아닌 다른것에 대해서도 검출하고 싶다는 것이다. http://coding-robin.de/2013/07/22/train-your-own-opencv-haar-classifier.html 위의 글에서는 바나나를 학습시키는데, 그냥 웃기려고 바나나를 선택한것은 아닐듯 싶다.바나나는 형태가 특이하며 다른 과일들과 구분하기 쉽기 때문에 학습시키기 참 좋으며 크고 굵고 노란 바나나는 포스팅에 올리기에도 참 맛있게 생겼다. 그렇다면 캐릭터를 한번 훈련시켜보면 어떨까? 적당한 캐릭터를 찾고 싶었는데, 마침 볼펜 꼭다리에 캐릭터가 달려있다. 이걸 한번 찾아보고 싶다. 물론 학습시키는 데이터는 적어도 캐릭터가 포함..

OpenCV 명령어 관련 정리

참고 (아래의 요약에 대한 설명자료) http://darkpgmr.tistory.com/70 single expand - 하나의 positive 샘플을 변형(하나만 있으므로 어쨌든 변형필요) multi preserve - 입력된 여러개의 positive샘플을 그대로 저장 multi expand - 입력된 여러개의 positive샘플을 변형 샘플제작시 -w : 가로 -h : 세로 -img : 입력받은 이미지 -vec : 변형된 파일들 명 -bg : 백그라운드컬러, 알아서 백그라운드컬러를 합성함 -bgthreshd : 백그라운드컬러 생성시 다양함을 주기위한 범위값 -maxidev : 밝기값 변형 -maxxangle (y/z) : 회전 변형 (물체가 항상 땅에있는상태라면 적게) -num : 만들 샘플 데이터 ..

각 영상인식 방법들의 간략 비교

글을 하나 포스팅하려 했건만, 이사람은 항상 다 정리해놓았다. 대단하다 정말.. http://darkpgmr.tistory.com/116 그래도 짧게 간추린 글을 보고싶으므로, 그것만 해보자면 SIFT(Scale Invariant Feature Transform) - 특징점 주변의 gradient 분포특성 이용, 기하학적 정보 무시, 형태변화 크기변화에 강하다. 큰변화 감지가능 HOG(Histogram of Oriented Gradient) - 블록단위 기하학적 정보 유지, 블록내부에서는 히스토그램을 사용해 조그마한 변화 감지 가능 큰변화 감지불가, 작은변화 감지가능 Haar Feature - 기본 특징 (영역과 영역의 밝기차 이용) 들을 수천가지 조합하여 특징추출 contrast 및 광원에 대한 검출 ..

OpenCV 빠르게 이용해서 얼굴 판별

출처 : Face Recognition With Python, in Under 25 Lines of Code https://realpython.com/blog/python/face-recognition-with-python/ 참고 : 바나나 이미지센싱 (^^;;) http://coding-robin.de/2013/07/22/train-your-own-opencv-haar-classifier.html Localising Organs of the Fetus in MRI Data Using Python http://www.slideshare.net/kevinkeraudren/pydata-london-2015 Setup OpenCV for Python in Windows http://luugiathuy.com/..