2017년 4월 5일 수요일

주가 패턴분석 (K-Means Clustering)

혼자 몰래하는 블로그였는데 systrader님(블로그) 페이스북에 포스팅2개가 링크되면서 갑자기 방문객이 늘었다..; 스스로 나중에 보려고 올리는 글들이라 다른 사람들에게 도움이 될 지 모르겠다. 꾸준히 블로그를 올릴만큼 부지런하지는 않으니 곧 다시 나만 하는 블로그가 되겠지.

K-Means Clustering 이라는 비지도 학습(unsupervised learning)을 이용하면 군집 분석을 쉽게 할 수 있다. 정해진 K개 그룹의 중점(centroid)을 구하고 데이터와 거리를 계산해 업데이트 방법으로 원리도 간단하다.

R을 이용해 2007년부터 5일간격으로 삼성전자의 20일 동안 주가를 8개 패턴으로 분류한 결과다. 패턴 8과 같은 경우가 20일 동안 지속적으로 상승하는 유형이고 패턴 2가 반대로 하락하는 유형이다. 빈도수를 보면 8번, 2번, 7번 순으로 많다. 위의 패턴번호를 삼성전자 주가에 표시해 그리면 다음과 같다.


최근엔 지속 상승하는 8번 유형에서 둔화된 7번, 5번 유형으로 변하는걸 볼 수 있다. 

이렇게 구한 패턴유형은 다른 모델의 input feature로 활용할 수 있다. 자신의 트레이딩 규칙, 알고리즘이 어떤 패턴에 잘 맞는지 확인해보는 것도 좋을 듯하다.

다른 분들처럼 본문에 R 코드를 삽입할까 했는데 코드가 너무 간단해 생략...

0 개의 댓글:

댓글 쓰기