AI로 시장을 이길 수 있는가? (KOSPI 예시 기초 방법론)
제가 현재 텔레그램/메일링을 통해 송부드리고 있는 마켓타이밍 모델도 AI=머신러닝이라는 관점에서는 AI 모델로 볼 수가 있습니다(클러스터링 모델). 세미나에서 말씀드렸다시피 딥러닝(신경망 모델)은 머신러닝의 한 부류에 불과합니다. 하지만 딥러닝이든, 딥러닝을 제외한 머신러닝 알고리즘이든 적용 과정은 대체로 유사합니다. 알고리즘에 따라 튜닝(최적화) 과정이 다르긴 하지만 최근 나오는 Pycaret과 같은 신규 라이브러리들은 하드코딩이 아닌 Auto ML, 즉 쉬운 머신러닝을 목표로 하고 있기 때문에 접근이 더 용이해지고 있습니다.
머신러닝을 활용한 모델링 방법론을 코스피 마켓 타이밍 예시를 통해 말씀드리겠습니다. 인공신경망(딥러닝) 모델을 활용합니다. 접근법은 분류 지도학습 방법입니다. 즉, 주어진 독립변수에 따라 상승, 또는 하락이라는 레이블(종속변수)를 지정하여 모델의 파라미터를 업데이트합니다. 이전 자료에 소개드린 방식은 비지도학습, 즉 종속변수 없이 시장 국면을 분류하는 방식입니다.
2010년부터 현재까지의 데이터를 활용하겠습니다. 데이터를 모델 학습을 위한 in-sample, 그리고 테스팅을 위한 out-sample로 분류합니다. 그리고 in-sample 내에서도 최근 20% 구간은 검증 데이터로 활용합니다. 검증 데이터(validation data)는 in-sample과 out-sample을 나누고나서도, out-sampe 테스팅 전 in-sample 내에서의 80%의 데이터만 학습에 활용하고, 20% 데이터로 검증을 해보고자 하는 방식입니다. 개인적으로는 금융 시계열은 길이가 너무 짧아서, 검증 데이터의 의미가 크지는 않다고 생각합니다.
제가 현재 텔레그램/메일링을 통해 송부드리고 있는 마켓타이밍 모델도 AI=머신러닝이라는 관점에서는 AI 모델로 볼 수가 있습니다(클러스터링 모델). 세미나에서 말씀드렸다시피 딥러닝(신경망 모델)은 머신러닝의 한 부류에 불과합니다. 하지만 딥러닝이든, 딥러닝을 제외한 머신러닝 알고리즘이든 적용 과정은 대체로 유사합니다. 알고리즘에 따라 튜닝(최적화) 과정이 다르긴 하지만 최근 나오는 Pycaret과 같은 신규 라이브러리들은 하드코딩이 아닌 Auto ML, 즉 쉬운 머신러닝을 목표로 하고 있기 때문에 접근이 더 용이해지고 있습니다.
머신러닝을 활용한 모델링 방법론을 코스피 마켓 타이밍 예시를 통해 말씀드리겠습니다. 인공신경망(딥러닝) 모델을 활용합니다. 접근법은 분류 지도학습 방법입니다. 즉, 주어진 독립변수에 따라 상승, 또는 하락이라는 레이블(종속변수)를 지정하여 모델의 파라미터를 업데이트합니다. 이전 자료에 소개드린 방식은 비지도학습, 즉 종속변수 없이 시장 국면을 분류하는 방식입니다.
2010년부터 현재까지의 데이터를 활용하겠습니다. 데이터를 모델 학습을 위한 in-sample, 그리고 테스팅을 위한 out-sample로 분류합니다. 그리고 in-sample 내에서도 최근 20% 구간은 검증 데이터로 활용합니다. 검증 데이터(validation data)는 in-sample과 out-sample을 나누고나서도, out-sampe 테스팅 전 in-sample 내에서의 80%의 데이터만 학습에 활용하고, 20% 데이터로 검증을 해보고자 하는 방식입니다. 개인적으로는 금융 시계열은 길이가 너무 짧아서, 검증 데이터의 의미가 크지는 않다고 생각합니다.
❤3👍1
모델 학습이 잘 되고 있는지 확인해보기 위해서는 에포크(학습 횟수)에 따른 손실함수 추이 그래프를 그려야합니다. (상승, 상승, 하락, 상승..)과 같이 동일한 클래스의 분류를 여러 개 해야되는 경우는 Binary Cross Entropy(BCE)를 손실함수로 활용합니다. 그래프 상에서 훈련 데이터와 검증 데이터의 Loss가 동시에 감소하는 것을 확인할 수가 있습니다. 훈련 손실은 감소하는데, 검증 손실이 감소하지 않으면 모델이 훈련 데이터에 과적화되고 있다고 판단할 수 있습니다. 이런 경우는 out-sample testing의 성과가 좋지 않을 가능성이 높습니다. 동시에 모델의 정확도(accuracy) 지표도 확인해줍니다. 정확도는 전체 예측 내 정답의 비율입니다. 정확도가 훈련 횟수에 따라 훈련, 검증 데이터 모두에서 점차 증가하는 것을 볼 수 있습니다.
👍3
손실함수/정확도 그래프를 통해 모델의 학습이 잘 이뤄지고 있다는 것을 확인하더라도, 반드시 또 확인해야하는 것이 있습니다. 바로 클래스 추정치(확률)의 분포입니다. 만약 추정 클래스의 빈도가 0.5 부근에 몰려있는 정규분포와 유사한 모양이라면, 모델이 클래스를 랜덤하게 부여하고 있다는 의미입니다. 이런 경우는 모델의 정확도가 높더라도 받아들일 수 없습니다. 우연적 요소가 크기 때문입니다. 이번 예시의 모델 같은 경우는 in-sample과 out-sample 모두 추정치의 분포가 0과 1에 가까운 값으로 분포되어 있는 U자형입니다. 학습이 잘 이뤄졌다고 볼 수 있습니다.
👍4
마지막으로 백테스팅입니다. 실제 상승/하락 예측 확률에 따라 매수 또는 공매도 포지션에 진입합니다. 단순하게 클래스 추정치의 임계치를 0.5로 설정하여 0.5 이상인 경우는 매수, 반대는 공매도로 진입합니다. 물론 in-sample 내에서 최적의 임계치를 정하여 out-sample에 적용하는 것도 가능합니다. In-sampe과 out-sample 모두 유의미한 성과를 나타냅니다.
👍3
조금 더 보수적인 평가를 위해, 조건 두개를 더 넣도록 합니다. 1) 오늘 시그널 발생시 내일 시가로 포지션 변경, 2) 거래비용 포지션 변경시마다 0.01% 감안(매수 매도 각각 계산, 즉 매매 1회당 0.02%). 해당 조건 반영시 다음과 같은 차트가 나옵니다
👍4❤1
위에 설명된 내용은 곧 발간될 인뎁스 자료 내에서도 다룰 예정이며, 단기 방향성 파악에 용이합니다. 참고로 이 모델상의 현재 코스피 단기 방향성은 short입니다.
👍4❤2
* 유진 경제 이정훈
- BOJ는 6월 금정위에서 정책금리 동결 및 무제한 양적완화 정책을 유지. 아직 내년도 물가 및 임금 상승에 대한 불확실성이 크다는 판단
- 그러나 성명문 상에서 2023년 중반 이후 인플레이션이 완만하게 반등할 것으로 예상, 중장기 인플레이션에 대한 인식이 좀 더 긍정적으로 변화하는 모습. 다음 달 부터 과거 통화정책에 대한 검토 내용도 웹페이지를 통해 업데이트할 예정
- 리오프닝으로 경기 회복되며 중앙은행의 인플레 인식 좀 더 낙관적으로 변할 가능성 높음. 그러나 정책 변경 서두르지는 않을 전망. 지난해 깜짝 정책 수정의 주 원인이었던 채권 시장의 기능 저하가 최근 개선되는 모습 나타남
- 현재 일부에서 기대하는 7월 추가 정책 수정 가능성은 낮으며, 올해 4분기 - 내년 1분기 경 추가 정책 수정에 나설 것으로 예상
- BOJ는 6월 금정위에서 정책금리 동결 및 무제한 양적완화 정책을 유지. 아직 내년도 물가 및 임금 상승에 대한 불확실성이 크다는 판단
- 그러나 성명문 상에서 2023년 중반 이후 인플레이션이 완만하게 반등할 것으로 예상, 중장기 인플레이션에 대한 인식이 좀 더 긍정적으로 변화하는 모습. 다음 달 부터 과거 통화정책에 대한 검토 내용도 웹페이지를 통해 업데이트할 예정
- 리오프닝으로 경기 회복되며 중앙은행의 인플레 인식 좀 더 낙관적으로 변할 가능성 높음. 그러나 정책 변경 서두르지는 않을 전망. 지난해 깜짝 정책 수정의 주 원인이었던 채권 시장의 기능 저하가 최근 개선되는 모습 나타남
- 현재 일부에서 기대하는 7월 추가 정책 수정 가능성은 낮으며, 올해 4분기 - 내년 1분기 경 추가 정책 수정에 나설 것으로 예상
❤4👨💻1
* 유진 경제 이정훈
<미국 주택시장이 왜 이래>
- 지난해 부진했던 미국 주택 경기는 올해 들어 반등 중. 착공/판매/주택 가격 모두 상승 전환
- 모기지 금리가 고점 대비 소폭 하락했고, 병목현상도 완화. 그러나 재고 부족이 주택 시장 반등의 주요 원인. 팬데믹 기간 2~3% 대 금리로 집을 산 사람들은 현 수준의 금리에서 굳이 지금 집을 팔고 새로운 집으로 이사 갈 유인이 없음. 신규주택과 달리 기존주택 재고가 역대 최저 수준인 이유
- 공장/인프라 등 비주거 건설 경기가 이미 견조한 상황에서 향후 주택 경기 반등은 미국 경기 하방을 지지해줄 것으로 예상. 이는 연내 금리 인하가 쉽지 않은 이유이기도 함
- 최근 주택 가격이 반등했으나 주거비 인플레이션을 논할 단계는 아니며, CPI 임대료 상승률은 시차를 반영해 내년까지 둔화 흐름 이어갈 것
<미국 주택시장이 왜 이래>
- 지난해 부진했던 미국 주택 경기는 올해 들어 반등 중. 착공/판매/주택 가격 모두 상승 전환
- 모기지 금리가 고점 대비 소폭 하락했고, 병목현상도 완화. 그러나 재고 부족이 주택 시장 반등의 주요 원인. 팬데믹 기간 2~3% 대 금리로 집을 산 사람들은 현 수준의 금리에서 굳이 지금 집을 팔고 새로운 집으로 이사 갈 유인이 없음. 신규주택과 달리 기존주택 재고가 역대 최저 수준인 이유
- 공장/인프라 등 비주거 건설 경기가 이미 견조한 상황에서 향후 주택 경기 반등은 미국 경기 하방을 지지해줄 것으로 예상. 이는 연내 금리 인하가 쉽지 않은 이유이기도 함
- 최근 주택 가격이 반등했으나 주거비 인플레이션을 논할 단계는 아니며, CPI 임대료 상승률은 시차를 반영해 내년까지 둔화 흐름 이어갈 것