금융과 딥러닝 - 금융 영역에서의 딥러닝은 어떻게 다른가?

Описание к видео 금융과 딥러닝 - 금융 영역에서의 딥러닝은 어떻게 다른가?

발표자: 문효준 (크래프트테크놀로지스)
더욱 다양한 영상을 보시려면 NAVER Engineering TV를 참고하세요. https://tv.naver.com/naverd2

발표월: 2019.3.

○ 개요
Frequency별 금융 상품 소개 (크래프트 프로젝트 소개)
Ultra low frequency : 자산배분문제 (3달 ~ 6달)
low frequency : 로보어드바이저 (2달~3달)
median frequency : 펀드, ETF (1달~2달)
high frequency : 주문집행, 마켓메이킹 (일단위 밑)

○ 문제점 정의
금융데이터로 딥러닝을 할 경우 왜 학습이 안 되는가?
: 문제점 1 : Feature 종류 대비 짧은 Sequence 길이
: 문제점 2 : Feature 자체의 노이즈
: 문제점 3 : 문제점 1, 2로 인한 오버피팅 문제
레몬마켓
: 위 문제점들로 인해, 1) 퀀트 only 2) 퀀트 + 딥러닝 3) 잘못된 딥러닝이 대부분임.
: 이런 문제로 기존 로보어드바이저는 AI라는 이름을 달고 나오지만 실제로는 AI가 아닌 경우도 있고, 딥러닝을 쓰지만 성과가 나쁜 경우가 대다수임. 이런 문제로 금융 + 딥러닝 업체들에 대한 레몬마켓 현상이 발생.

○ 크래프트 해결책 (직관에 대한 최적화)
(문제점1) Feature 종류 대비 짧은 Sequence를 어떻게 해결할 것인가?
: GAN등의 방법으로 Sequence를 연장할 수도 있지만 GAN 데이터가 시계열 데이터의 패턴을 완벽하게 반영하지 않으면 데이터 생성의 의미가 없으면, 금융데이터는 시계열 간의 관계도 매우 중요함. 따라서 부적절
: 직관적으로 퀀트들은 이런 문제를 해결하기 위해 경제적 함의점을 가지는 퀀트모델들을 만듦. (간단한 팩터모델들 소개)
: 우리는 퀀트모델들에 대한 직관적 사고 방식을 모사하는 딥러닝 모형을 설계. (팩터 모델, 자산배분모델 등에서 매우 잘 작동함을 확인)

(문제점2) Feature 자체의 노이즈를 어떻게 해결할 것인가?
: stacked CNN AutoEncoder 기반의 노이즈 제거기술. 모듈로 확장가능성 존재
: (노이즈 제거가 잘 되는 자료 첨부, 이로 인한 학습 효과 증대)

(문제점3) 그럼에도 발생하는 오버피팅 문제를 어떻게 해결할 것인가?
: Asynchronous Multi Network Learning Framework 소개.
: Beam search와 유사하게 각 프로세서 개별적으로 초기화된 네트워크를 가지고 학습을 진행. validation data로 검증 후 적자생존 방식으로 오버피팅 발생가능성 최소화


발표 슬라이드:
https://www.slideshare.net/NaverEngin...

Комментарии

Информация по комментариям в разработке