株価分析のための時系列データクラスタリング入門

Описание к видео 株価分析のための時系列データクラスタリング入門

DEIM2023チュートリアルにて講義が行われました。
https://event.dbsj.org/deim2023/post/...

講師
白田由香利(学習院大学経済学部経営学科教授)

概要
株価変動分析においても機械学習の時系列データクラスタリング手法が広く使われている.代表な距離定義はk-Shape法のSBD,及びDTWなどであるが,これらは入力データの標準化を前提とするので,重要な分散(リスク)情報を捨て去ってしまうという問題がある.株価分析においては,現在も,1952年にハリー・マーコウィッツが創案した「収益率の平均 (平均リターン) とリスク(リターンの標準偏差)の散布図」による分析法が広く使われている.この手法ではリスク情報を捨てずに用いているが,より詳細な変動パターン(V字回復,S字型など)を知るためには,機械学習クラスタリングが必要となる.しかし,例えば,テスラやインドIT企業の株価のように成長率が大きい銘柄の場合,k-Shape法では分散情報が除去されてしまい分析目的に合致しない.そこで我々はAmplitude-based clustering法という,分散情報の変動パターンを解析する新アルゴリズムを開発した.現在我々は,第1段階でAmplitude-based clusteringを行い,伸び幅とパターンによって荒く分類し,第2段階で詳細を分析したいクラスターに対してk-Shape法を行うという二刀流のアプローチをとっている.次元圧縮としてはUMAPを使っている.本講義では,マーコウィッツの散布図の作り方から説明を始め,上記二刀流の手法による分析方法を示す.クラスタリング結果についてUMAP上で考察するプロセスも解説する.事例として,世界の製造業及び2022年のUS企業,インド企業などの株価分析結果を示す.全編グラフィクスの多用により,見るだけで違いが分かるようにする.

Комментарии

Информация по комментариям в разработке