여기서 할것은 세가지이다.
1) 존재하는 상장주식의 종류를 저장해서
2) 관련된 정보를 Google Finance나 에서 긁어온다.
목표는 3시간안에 위의 작업을 하는게 목표지만, 예상은 약 5시간이 걸릴거라고 예상한다.
존재하는 상장주식의 정보를 찾는것은 어디서 찾으면 될까. 한국거래소가 있다.
http://www.krx.co.kr/m6/m6_1/m6_1_1/JHPKOR06001_01.jsp
여기서 모든 상장주식의 정보를 다운로드 할수 있다.
만약에 파생상품을 생각하고 있다면 여기서 통계데이터를 구입하는것도 나쁘지 않아 보인다.
http://www.krx.co.kr/por_kor/m8/m8_8/m8_8_2/m8_8_2_1/JHPKOR08008_02_01_03.jsp?strCode=1142&strImg=05_02
다만 조금 비싸다.
2015년 5월 기준 1901개의 상장주식이 있다.
1901개의 코스피 주식을 퍼올 수 있었다. 이제,
자 이제 이 기준, 파이썬으로 모든 데이터를 긁어와 보겠다. 작동방식은 Ajax로 한꺼번에 Request를 보내 바로바로 데이터베이스에 저장하도록 한다. 경험상 약 70%정도의 데이터만 긁어와지는것을 확인할수 있는데 적어도 95%이상의 data fetch를 달성하기 위해, 일정이상의 시간이 걸리면 연결을 끊고 다시 시도하게끔 프로그래밍 하는것이 중요하다.
'도메인 > 금융공학' 카테고리의 다른 글
신경망 참조 (0) | 2015.05.13 |
---|---|
NASDAQ 주식 리스트 (0) | 2015.05.08 |
이동평균선의 통계적 근거 (0) | 2015.04.28 |
첫번째 시뮬레이션 - 골드크로스의 실제 타당성 여부 검사 (0) | 2015.04.26 |
이동평균 데이터 분석하기 (0) | 2015.04.25 |