도메인/금융공학

파이썬 시작, Xing API 이용하기 (4) - 판다스 콜렉션

늘근이 2015. 4. 18. 05:58

아침에 일어나서 약 한시간동안 시간이 생겼다.

일단 어제 하던 파이썬을 조금더 진행할까보다. 일단 두시간 째


일단 이름부터 요상한 아나콘다를 깔아야 한다고 한다. 아나콘다는 여러가지 프로그램을 동시에 제공해주기 때문에 굳이 의존성관리를 해주지 않아도 되는 큰 장점이 있다고 배웠다. 좋다. 그렇다면 이제 제대로 데이터를 받아보고 실행시켜보자.

앞에서 잠시 언급했던 QtConsole로 여러가지 데이터를 마치 리눅스처럼 제어할수 있다고 했다.




그렇다. 위와같은 화면이 보인다. 일단 뭔가 깔끔해 보이기는 한다.


이제, 판다스의 자료구조, 즉 콜렉션 API가 또 있나보다. 이건 주식을 분석할때 쉽게 쓸수가 있으므로 상당히 유용할듯한 느낌이다.


from pandas import Series, DataFrame 


자 이렇게 해놓으면, 대충 콜렉션 API를 사용할수 있나보다


Series


시리즈는 굳이 인덱스를 주지않고 데이터만 넣으면 seq퀀셜하게 막 들어가기도 하고, 아니면 index를 따로 넣을수도 있는것으로 보인다.



dtype: int64

stockPrice
Out[3]:
01-26    30000
01-25    20000
01-24    15000
dtype: int64 



DataFrame

데이터 프레임은 아예 index와 값으로 들어가는 맵형이 아니라 그냥 이차원으로 만들수 있다.


data = {'price':[30000,20000,15000], 'date':['01-26','01-25','01-24'], 'info':['상승','하락','이도저도아닌거']}

dataFrame = DataFrame(data)

dataFrame
Out[11]:
    date     info  price
0  01-26       상승  30000
1  01-25       하락  20000
2  01-24  이도저도아닌거  15000 


음 일단 데이터가 잘 들어가는데 구분자를 잘 생각해봐야한다. 시리즈 넣듯이 막 생각없이 넣으면 잘 안들어가는듯 하다.



dataFrame['date'] 


이렇게도 데이터를 뽑아올수 있다. 다만 하나 신기한것은 ix기능을 통해 행열을 피벗돌려서 가져올수 있다는 것이다.

ix함수를 이용하면 된다. 이게 다른 프로그래밍언어에 없는 신기한 기능인것 같다. 상당히 데이터 분석에 강점이 있는 콜렉션인듯하다. 자바는 열심히 루프를 돌려야 할텐데 뭐 이정도의 기능이면 지면을 할애해 소개하고있는것이 아주 이해가 된다.