크래프트테크놀로지스의 NAVER D2 강연을 정리한 리뷰입니다.
◾QraftTech. 기업 소개
- 국내 최대 로보어드바이져 서비스 공급사
- 세계 최초 글로벌 AI ETF 상장 & 국내 최초 AI ETF 뉴욕증시 상장
- 국내 최초 AI 주무 시스템 개발 > axe challenge 1위 달성(2018년)
◾금융 딥러닝 분야에 대한 QraftTech.의 생각
🔻금융 딥러닝의 실패 요인들
🔸문제점1) 시계열 feature의 심한 노이즈
- 일반적으로 주가 모델링은 기하브라운운동모형(Geometric Brownian Motion)을 따른다고 가정한다.
- Brownian Motion : Markov Property, 즉 이전 행동이 다음 행동의 확률에 영향을 미치지 않는 무작위적인 성질을 갖는 운동
- GBM : Markov Chain Monte Carlo에 따른 주식 시뮬레이션의 기반이 되는 모형. \[ S_t = S_0 e^{\sigma W_t + \Big(\mu - \frac{\sigma^2}{2} \Big)t} \]
- \(S_t\) : t 시점의 주가 (n = 시간 단위, t = 행동 시점)
- \(\sigma\) : 표준편차 = 주식 수익률
- \(\mu\) : Drift = 주가의 평균적인 증가 또는 감소를 나타내는 추세 항목
- \(W_t\) : 4가지 성질을 만족하는 확률과정(ref : 주식의 수학적 모델 #1)
- [ref : 주식의 수학적 모델 #3 : GBM모델 , 32. 기하브라운운동과 내재변동성]
- 금융 딥러닝의 문제점을 쉽게 설명하기 위해 GBM대신 AR1(autoregressive model)로 설명한다.
- \[ y_{t+1} = y_t + x_t + \epsilon_t \]
- AR1 모델에 따르면, 다음 주가(t+1시점의 주가)는 t시점의 주가\(y_t\)와 어떤 정보\(x_t\), 그리고 노이즈\(\epsilon_t\)가 더해진 결과이다.
- 이 때, 딥러닝 모델이 포착해야 하는 것은 \(x_t\)이다.
- 그러나 금융 데이터는 주로 \(\epsilon_t > x_t\), 즉 노이즈가 심해 딥러닝 모델이 정확한 피처를 파악하기 어렵다.
- 크래프트테크놀로지스는 기존 LSTM 주가 예측 모델이 단순 '오른쪽으로 lagging된 형태'로 나타나는 이유가 바로 이 노이즈가 심한 것 때문이라 판단했다.
[흔한 LSTM 주가 예측 모델 : 빨간선 = 실제 주가, 파란선 = 예측 주가]
🔸문제점2) Feature 종류 대비 짧은 Sequence 길이
- 금융 데이터에서는 사용할 feature의 종류는 많다. 자산 배분을 예로 들었을 때 자산군 모멘텀 효과, 자산군 평균회귀 효과, 확장적/긴축적 통화정책 분류, 단기부채사이클/장기부채사이클 파악 등의 feature가 있다.
- 그러나 이런 유의미한, 집약적인, 추상적인, 개념적인 High Level Feature는 주로 주기성이 길어서 데이터가 많지 않다. 주로 monthly frequency 혹은 quarterly frequency를 갖는다.
- feature의 개수는 많은데 데이터의 양이 적을 때, 차원의 저주 문제(the curse of dimensionality)가 발생한다.
- 차원의 저주 : 고차원 데이터일수록 노이즈가 증가하고 모델의 일반화 능력이 저하되는 문제이다. 이를 해결하기 위해 차원 축소 기법(PCA, LDA 등)이 개발된다.
🔸문제점3) 문제점 1, 2로 인한 Overfitting
🔻해결방안
🔸1. 시계열 feature의 denoising 방법들
- Moving Average : 이동평균선, 주식에서 자주 사용되는 denoising 기법이지만 오른쪽으로 lagging된 형태를 띈다.
- Bilateral Filter : lagging되는 문제점은 감소한다. 여전히 분산이 크기 때문에 효과적이라고 할 수 없다.
Bilateral Filter는 Gaussian Filter를 양뱡향에서 적용시킨 것이다. - 이외에도 다양한 denoising기법들(푸리에 변환, 웨이블릿 변환, AutoEncoder)이 있다.
- CNN Stacked AutoEncoder기반 denoising model : 크레프트테크놀로지스에서 개발한 모델로 smoothing이 잘 이루어지며 CNN filter 크기에 따라 분산 정도를 조절할 수 있다고 한다.
[영상 발표자료 : CNN Stacked Autoencoder의 아키텍쳐, 결과. (파랑 : 실제 환율, 초록 : 이동평균선, 주황 : CNN기반 denoising결과)]
🔸2. 짧은 시계열 길이에 대한 해결방안
- 크래프트테크놀로지스에 따르면 생성모델을 활용한 데이터 증강(augmentation)은 효과가 없었다고 한다.
- 기존 퀀트 투자의 방식에서 영감을 얻으려 했으나 경제적 함의점(=직관)을 모델링하는 것은 불가능하기에 결국 모델을 최적화하는 방식을 선택했다고 한다.
- Factor Investing 모델은 그대로 가져가되, factor alpha를 동적으로 변환하는 방식으로 모델을 최적화했다.
-
Factor Investing : 어떤 투자 종목을 quality, size, value, momentum, low risk 등의 factor로 구분하여 투자하는 방식이다.
factor investing에서 말하는 alpha란? 투자자나 포트폴리오 관리자가 시장 수익률을 뛰어넘는 추가 수익을 의미한다. 따라서 factor investing에서는 어떤 factor의 alpha이 양수이면 해당 factor가 긍정적인 요인임을 알 수 있다.
beta란? 특정 주식이나 포트폴리오가 시장 지수에 대해 얼마나 민감한지를 의미한다. 일반적으로 시장 지수의 움직임에 대한 주식 또는 포트폴리오의 상대적인 변동성을 측정하는 지표이다. - quality : 기업의 재무 건강성과 안정성을 나타내는 지표
- size : 기업의 시가총액
- value : 주가와 회계적 가치 사이의 차이를 기반으로 하는 기업 가치 지표
- momentum : 주가나 수익률의 추세 관련 지표
- low risk : 주가의 변동성이나 리스크 관련 지표
- Qraft는 바로 이 factor alpha가 항상 일정하지 않다는 점에 주목했다.
- Dynamic Factor Rotation
- 논문 리서치를 통해 경제상황에 따른 주요 factor를 파악했다고 한다. 예를 들어 유동성이 높으면 momentum이 증가하고 경제활동이 활발해지면 value가 증가함을 확인했다.
- 이렇게 전문가들의 경험적인 판단을 모델링하여 동적으로 변동하는 factor investing 모델을 개발했다고 한다.
[영상 발표자료 : 기존의 equal factor model(파랑)보다 dynamic factor model(빨강)이 더 high level feature(=factor alpha)를 더 잘 파악]
[영상 발표자료 : factor의 가중치 변동을 시각화한 그래프 > 금융위기 때마다 안정성과 관련된 quality, low risk facotr의 가중치를 높게 설정하는 등 유연한 factor 가중치 설정을 보여주고 있다.]
🔸문제점3) 문제점 1, 2로 인한 Overfitting
-
[ 검은 점 = 데이터 포인트, 선 = 모델의 예측선 ]
- sequence의 길이가 짧고 노이즈가 많기 때문에 위의 그림처럼 회귀분석의 결과가 초록, 파랑, 주황과 같이 차이가 날 수 있다.
- 기존의 L1, L2 regularization 방식을 사용하지 못하는 이유 : 일반적으로 데이터 수가 부족한 경우에 regularization 방식이 효과가 없는 것으로 알려졌다. dropout이나 규제 방식을 사용하면 파란선과 같이 예측이 이루어지는데 이것이 true value라고 단정지을 수 없다고 한다.
- 1. Asynchronous Multi Network Learning : 다수의 쓰레드로 여러 네트워크를 동시에 학습하는 방식으로 overfitting을 어느정도 보완 가능하다.
- 2. Bayesian Inference : 1번의 방법으로도 아래 그림의 분홍색 구간과 같은 새로운 유형의 데이터는 예측하지 못하는 문제점이 존재하기 때문에 이에 대해서는 베이지안 추론을 활용하기로 크래프트테크놀로지스는 결정했다.
[영상 발표자료 : bayesian inference]
- 크래프트테크놀로지스는 분홍색 구간 같은 데이터 포인트들을 overfitting 때문에 예측이 어렵다기보다는 uncertainty quantification 문제로 바라보았다.
- → Monte Calro dropout, Monte Carlo batch normalization, Gaussian Process Regression(GPR) 등이 uncertainty quantification 문제를 해결하는 기법들이다.
- MC(monte carlo)를 사용하는 방법들은 hyper parameter와 activation function의 영향이 크기 때문에 크래프트테크놀로지스는 간단하면서도 효과적인 Deep Learning Regression + GPR 방법을 선택했다고 한다.
◾Q&A 정리
본 강연은 크래프트테크놀로지스의 AI ETF 모델에 어떤 아이디어를 적용시켰는지 대략적으로 소개하는 영상이었다. 그래서 모델의 구체적인 구조는 소개되진 않았다. 대신 Q&A에서 조금 더 구체적인 설명을 해주어 이를 필기로 정리했다.
[Q : Qraft.사 모델의 목적 함수는 무엇인가?]
[Q : Dynamic Factor Rotation 모델의 구조에 대해 구체적으로 설명해줄 수 있는가?]
[A : 위 그림의 아키텍쳐는 강연자의 설명을 바탕으로 예상한 구조입니다.]
[Q : GPR 과정에 대해 구체적으로 설명해줄 수 있는가?]
[A : 강연자(문효준 대표)는 이에 대한 근거가 아직 부족하다고는 하지만 Qraft사의 성과로 미루어보면 효과는 있는 것으로 보인다.]
'기업 사례' 카테고리의 다른 글
[기업 사례] Nest Learning Thermostat - 스마트 냉난방 조절기 (1) | 2023.10.13 |
---|