30,000銘柄、900の予測変数、一つの問い
1957年から2016年にかけて、マクロ経済指標と企業特性で訓練されたニューラルネットワークは、個別米国株式リターンに対してサンプル外R二乗0.40%を達成しました。この数値は小さく見えますが、30,000銘柄以上の投資ユニバースでは、リターン予測のわずかな優位性でも経済的に有意なポートフォリオ利益に変わります。このニューラルネットワーク予測に基づいて構築されたロング・ショートポートフォリオは、シャープレシオ1.8以上を記録しました — 同期間に最良の線形モデルが達成した数値の2倍以上です。
これらは、現代実証ファイナンスで最も引用されている論文の一つとなった「Empirical Asset Pricing via Machine Learning」の主要な発見です。この論文はSheng Gu、Bryan Kelly、Dacheng Xiuによって執筆され、2020年にReview of Financial Studiesに掲載されました(Gu, Kelly & Xiu, 2020)。この論文はファイナンスの根本的な問題である株式リターン予測に適用されたすべての主要な機械学習手法の体系的な比較であり、その結論は効率的市場仮説の支持者とファクター動物園の懐疑論者の両方に挑戦を投げかけています。
問題:多すぎるファクター、足りないシグナル
資産価格決定にはデータの問題があります。過去30年間で研究者たちは株式リターンを予測するとされる数百の変数を提案してきました。簿価対時価、モメンタム、収益性、投資、発生額、株式発行、固有ボラティリティ — リストは現在400以上の公表されたアノマリーを超えています。Harvey、Liu、Zhuは2016年の論文でこの爆発的増加を記録し、これらの「発見」の大部分はデータマイニングによって増幅された統計的ノイズであると主張しました(Harvey, Liu & Zhu, 2016)。
この問題に対する伝統的なアプローチは線形的です。いくつかのファクターを選び、回帰分析を実行し、t統計量を確認します。ファーマ・フレンチ5ファクターモデルは5つの変数を使用します。最も野心的な線形モデルでも数十以上を使用することはまれです。理由は単純です:線形回帰は深刻なオーバーフィッティングなしに数百の相関した予測変数を処理できません。線形モデルに変数を追加すると、最終的に予測は改善するのではなく悪化します。
機械学習はこの計算を変えます。ランダムフォレスト、勾配ブースティング木、ニューラルネットワークなどの手法は、高次元でノイズの多いデータからシグナルを抽出するために特別に設計されています。これらは線形モデルが完全に見逃す変数間の非線形関係と相互作用を捉えることができます。Gu、Kelly、Xiuが問いかけた質問は、これらの手法が提案されたすべての株式予測変数のユニバースに適用された場合、実際にリターン予測を改善するかどうかでした。
手法の競争
この論文は同一データで訓練され、同一のサンプル外条件で評価された包括的な手法群をテストしています。伝統的な計量経済学的アプローチから最先端の機械学習まで多岐にわたります:
| 手法 | サンプル外 R² | 月次シャープ (L/S) |
|---|---|---|
| OLS(全予測変数) | -1.01% | 0.60 |
| OLS(3予測変数) | 0.16% | 0.89 |
| Elastic Net | 0.21% | 1.12 |
| Random Forest | 0.23% | 1.35 |
| Gradient-Boosted Trees | 0.34% | 1.51 |
| Neural Network (NN3) | 0.40% | 1.80 |
| Neural Network (NN5) | 0.36% | 1.71 |
これらの結果からいくつかのパターンが浮かび上がります。
第一に、全予測変数を使用したOLSは惨憺たる結果です。負のR二乗は、OLS予測を使用するよりもすべての株式に対して過去の平均リターンを予測する方がましだったことを意味します。これは高次元で線形モデルがオーバーフィットするという標準的な直感を確認しています。
第二に、正則化が大きく役立ちます。係数を縮小し変数を選択するペナルティ項付きの線形回帰であるElastic Netは、負のR二乗を正に転換します。しかしElastic Netは根本的にまだ線形であるため、改善はすぐに頭打ちになります。
第三に、木ベースの手法が線形手法を上回ります。ランダムフォレストと勾配ブースティング木は予測変数とリターン間の非線形関係を捉え、R二乗を押し上げ、シャープレシオを1.3以上に引き上げます。
第四に、ニューラルネットワークが勝利します。3層ニューラルネットワーク(NN3)が最高のサンプル外R二乗と最高のシャープレシオを達成します。5層ネットワーク(NN5)はやや劣り、この応用では深さに対する収穫逓減を示唆しています。
ニューラルネットワークが発見したこと
この論文の最も啓発的な貢献は、単なる競争結果ではなく、勝利モデルが実際に何を学習するかの分析です。変数重要度分析という手法を用いて、著者たちは各モデルの予測を分解し、どの入力が予測を駆動するかを特定します。
すべての非線形モデルで支配的な予測変数はモメンタムです — ただし単純な12ヶ月モメンタムではありません。ニューラルネットワークは短期リバーサル(1ヶ月リターン)、中期モメンタム(2-12ヶ月)、長期リバーサル(13-60ヶ月)間の複雑な相互作用を識別し、これらは市場環境によって変化します。高ボラティリティ環境では短期リバーサルが支配的です。穏やかな市場では中期モメンタムが主導します。
2番目に重要なカテゴリーは流動性と取引活動です。株式回転率、ビッド・アスクスプレッド、ドル取引高などの変数がサイズやモメンタムと線形モデルでは捉えられない方法で相互作用します。強いモメンタムを持つ小型で非流動的な株式は、同じモメンタムシグナルを持つ大型で流動的な株式とは異なる振る舞いをします。
3番目の主要な発見はマクロ経済的相互作用の重要性です。ニューラルネットワークは企業特性の予測力が景気サイクルとともに変化することを学習します。バリュー株(高い簿価対時価)は景気後退時にリターンをより強く予測する一方、モメンタムは景気拡大時により良く機能します。これらの時間変動的な関係は、固定係数を推定する標準的な線形モデルでは見えません。
ファクター動物園の飼いならし
Feng、Giglio、Xiuの関連論文は、この環境で機械学習が機能する理由について追加的な理論的根拠を提供しています(Feng, Giglio & Xiu, 2020)。彼らのフレームワークは根本的な問いに取り組みます:400以上の提案されたファクターの中で、どれが真にリスクを捉え、どれがノイズなのかをどう判別すればよいのでしょうか。
伝統的なアプローチ — 既存モデルに対してファクターを一つずつテストすること — は多重検定問題を無視するため統計的に欠陥があります。400の変数をテストすれば、約20は純粋に偶然によって5%水準で有意に見えます。
Feng、Giglio、Xiuは機械学習(具体的にはLASSO)を使用して、他のファクターを制御しながら重要なファクターを同時に選択する二重選択手続きを提案しています。150以上の公表されたファクターに適用した結果、大多数が冗長であることを発見しています。多重検定とファクター間の相関を適切に考慮した後、生き残るのはごくわずかなファクターだけです。生き残るファクター — 市場、サイズ、バリュー、モメンタム、収益性、そしてその他少数 — は、Gu、Kelly、Xiuのニューラルネットワークが重要と識別したものと密接に一致しています。
この収束は安心材料です。ニューラルネットワークは何か特殊で解釈不能なシグナルを発見しているのではありません。よく知られたファクターが線形モデルが見逃す非線形的な方法で相互作用していることを発見しているのです。
実務的な意味
実務的な含意は投資家の種類によって大きく異なります。
機関投資家とヘッジファンドにとって、この論文はクオンツ戦略における機械学習への移行を検証しています。サンプル外の利益は、効率的に取引できるポートフォリオであれば取引コストを差し引いても十分に大きいです。いくつかのシステマティックヘッジファンドが現在、ニューラルネットワークベースのリターン予測をコアシグナルとして使用しています。
個人投資家にとって、含意はより微妙です。これらの戦略を自宅で再現することはできません。この論文は30,000銘柄にわたる月次リバランスを使用しており、機関規模の執行インフラが必要です。ロング・ショートポートフォリオはまた空売りを必要としますが、これは個人口座では高コストで、時に不可能です。
しかし、この発見は個人投資家がファクター投資について考える方法に間接的な含意を持ちます。真のリターン生成プロセスが非線形であるなら — モメンタムがボラティリティの高い市場と穏やかな市場で異なる動きをし、バリューが景気サイクルに依存するなら — 単純で固定的なファクターエクスポージャーは利用可能なプレミアムの一部しか捉えません。これは固定ルールを単一の特性に適用するファクターETFがバックテスト対比で成果が劣る理由を説明する助けになります。真のプレミアムは機械学習手法が捉えられるが固定ルールでは捉えられない動的で条件付きのファクターエクスポージャーから生まれます。
限界と未解決の問い
この論文の強みは同時に限界でもあります。60年の標本期間(1957-2016)は複数の市場レジームを含み、一般化に有利です。しかし、ほぼゼロの金利、前例のない中央銀行介入、パッシブ投資の台頭に特徴づけられる直近の10年は構造的な転換点を表す可能性があります。1957-2016のデータで訓練されたモデルはパンデミック後の環境では同じ性能を発揮しない可能性があります。
慎重なサンプル外設計にもかかわらず、オーバーフィッティングは依然として懸念事項です。著者たちはモデルを定期的に再訓練するローリングウィンドウアプローチを使用していますが、ハイパーパラメータ(ネットワーク深度、正則化強度、学習率)の選択にはいくらかの先読みバイアスが含まれています。Kelly、Malamud、Zhou(2024)は後続の論文で、複雑なモデルが単にオーバーフィットするのではなく高次元環境で真に優れた性能を発揮できる理由について理論的正当化を提供しています(Kelly, Malamud & Zhou, 2024)。
取引コストは認識されていますが完全には組み込まれていません。この論文はコスト差引前のシャープレシオを報告しており、最も収益性の高い戦略は実装コストが最も高い小型で非流動的な株式での活発な取引を含みます。現実的な取引コスト調整後、ニューラルネットワークとよりシンプルな手法の優位性は縮まりますが、消失はしません。
最後に、この論文は米国株式にのみ焦点を当てています。同じパターンが国際市場、債券、その他の資産クラスで成立するかどうかは活発な研究課題として残っています。国際研究からの初期の証拠は有望ですが決定的ではありません。
より大きな視点
Gu、Kelly、Xiuの論文は実証的資産価格決定における転換点を示しています。統計手法の選択 — 線形対非線形、シンプル対複雑 — が予測変数の選択と同等に重要であることを実証しています。数十年間、資産価格研究は同じ線形回帰ツールキットを使いながら新しい変数の発見に焦点を当ててきました。この論文はツールキット自体がボトルネックだったことを示しています。
含意はリターン予測を超えて広がります。株式リターンが真に非線形ファクター相互作用によって駆動されているなら、学術・実務ファイナンスを支配する標準的ファクターモデル — 3ファクター、5ファクター、6ファクターモデル — は根本的に誤った定式化をしていることになります。これらは一次効果を捉えますが、機械学習手法が活用する高次相互作用を見逃しています。
これはファクターモデルが無用であることを意味するのではありません。概念的フレームワークやリスク帰属ツールとして依然として価値があります。しかし予測ツールとしては、かなりの予測力をテーブルに残しています。線形手法と非線形手法の間のギャップは、市場が標準モデルの仮定よりも複雑であるという実証的証拠です。
クオンツ戦略に投資するすべての方にとって — ヘッジファンド、スマートベータETF、あるいは独自のシステマティックアプローチを通じてであれ — この論文の中心的メッセージは明確です:手法はデータと同等に重要であり、最もシンプルなモデルが常に最良のモデルとは限りません。
この記事は教育目的のみであり、投資助言を構成するものではありません。過去の実績は将来の成果を保証するものではありません。
この分析は Gu, Kelly & Xiu (2020), Review of Financial Studies を基に QD Research Engine — Quant Decodedの自動リサーチプラットフォーム — が合成し、編集チームが正確性を確認しました。 私たちの方法論について.
参考文献
-
Gu, S., Kelly, B., & Xiu, D. (2020). Empirical Asset Pricing via Machine Learning. The Review of Financial Studies, 33(5), 2223-2273. https://doi.org/10.1093/rfs/hhaa009
-
Feng, G., Giglio, S., & Xiu, D. (2020). Taming the Factor Zoo: A Test of New Factors. The Journal of Finance, 75(3), 1327-1370. https://doi.org/10.1111/jofi.12883
-
Harvey, C. R., Liu, Y., & Zhu, H. (2016). ...and the Cross-Section of Expected Returns. The Review of Financial Studies, 29(1), 5-68. https://doi.org/10.1093/rfs/hhv059
-
Kelly, B., Malamud, S., & Zhou, K. (2024). The Virtue of Complexity in Return Prediction. The Journal of Finance, 79(1), 459-503. https://doi.org/10.1111/jofi.13298
-
Fama, E. F., & French, K. R. (2015). A Five-Factor Model of Expected Stock Returns. Journal of Financial Economics, 116(1), 1-22. https://doi.org/10.1016/j.jfineco.2014.10.010