資產定價中的機器學習：什麼真正有效

30,000檔股票、900個預測變數、一個問題

從1957年到2016年，一個使用總體經濟指標和公司特徵訓練的神經網路對個別美國股票報酬率實現了0.40%的樣本外R平方。這個數字看起來很小，但在30,000多檔股票的投資範圍中，即使是報酬率預測中微小的優勢也能轉化為經濟上顯著的投資組合收益。基於這些神經網路預測構建的多空組合獲得了超過1.8的夏普比率——比同期最佳線性模型所能達到的數值高出一倍多。

這些是現代實證金融中被引用最多的論文之一——「Empirical Asset Pricing via Machine Learning」的核心發現。該論文由Sheng Gu、Bryan Kelly和Dacheng Xiu撰寫，2020年發表於Review of Financial Studies（Gu, Kelly & Xiu, 2020）。這篇論文是對應用於金融核心問題——預測股票報酬率——的所有主要機器學習方法的系統性比較，其結論同時挑戰了效率市場陣營和因子動物園懷疑論者。

問題：太多因子，訊號不足

資產定價存在資料問題。過去三十年中，研究人員提出了數百個據稱能預測股票報酬率的變數。帳面市值比、動能、獲利能力、投資、應計項目、股票發行、特質波動率——該清單現已超過400個已發表的異常現象。Harvey、Liu和Zhu在2016年的論文中記錄了這一爆炸性增長，認為這些「發現」中的大多數是被資料探勘放大的統計雜訊（Harvey, Liu & Zhu, 2016）。

對這一問題的傳統方法是線性的。選擇少數幾個因子，執行迴歸，檢查t統計量。Fama-French五因子模型使用五個變數。即使是最具野心的線性模型也很少使用超過幾十個。原因很簡單：線性迴歸無法在不嚴重過度擬合的情況下處理數百個相關的預測變數。向線性模型添加更多變數最終會使預測變差而不是變好。

機器學習改變了這一計算。隨機森林、梯度提升樹和神經網路等方法專門設計用於從高維度、雜訊多的資料中提取訊號。它們能夠捕捉線性模型完全遺漏的變數間非線性關係和交互作用。Gu、Kelly和Xiu提出的問題是：當這些方法應用於所有已提出的股票預測變數的完整範圍時，是否真正改善了報酬率預測。

方法論競賽

該論文測試了一套全面的方法，全部使用相同資料訓練並在相同的樣本外條件下評估。方法從傳統計量經濟學方法到最先進的機器學習：

方法	樣本外 R²	月度夏普 (L/S)
OLS（全部預測變數）	-1.01%	0.60
OLS（3個預測變數）	0.16%	0.89
Elastic Net	0.21%	1.12
Random Forest	0.23%	1.35
Gradient-Boosted Trees	0.34%	1.51
Neural Network (NN3)	0.40%	1.80
Neural Network (NN5)	0.36%	1.71

這些結果揭示了幾個模式。

首先，使用所有預測變數的OLS是災難性的。負的R平方意味著對每檔股票預測歷史平均報酬率都比使用OLS預測更好。這證實了線性模型在高維度下過度擬合的標準直覺。

其次，正則化極大地幫助了預測。Elastic Net是帶有縮小係數和選擇變數的懲罰項的線性迴歸，將負的R平方轉為正值。但由於Elastic Net從根本上仍然是線性的，改善很快達到瓶頸。

第三，基於樹的方法優於線性方法。隨機森林和梯度提升樹捕捉預測變數與報酬率之間的非線性關係，將R平方推高並使夏普比率超過1.3。

第四，神經網路獲勝。三層神經網路（NN3）達到了最高的樣本外R平方和最高的夏普比率。五層網路（NN5）略遜一籌，暗示在此應用中深度的報酬遞減。

神經網路發現了什麼

該論文最具啟發性的貢獻不僅是競賽結果，還有對獲勝模型實際學到了什麼的分析。使用變數重要性分析技術，作者分解了每個模型的預測，以識別哪些輸入驅動了預測。

在所有非線性模型中，主導預測變數是動能——但不是簡單的12個月動能。神經網路識別出短期反轉（1個月報酬率）、中期動能（2-12個月）和長期反轉（13-60個月）之間的複雜交互作用，這些交互作用隨市場條件而變化。在高波動率環境中，短期反轉占主導。在平靜的市場中，中期動能接管。

第二重要的類別是流動性和交易活動。股票周轉率、買賣價差和美元交易量等變數以線性模型無法捕捉的方式與規模和動能交互。具有強勁動能的小型非流動股票與具有相同動能訊號的大型流動股票表現不同。

第三個關鍵發現是總體經濟交互作用的重要性。神經網路學到了公司特徵的預測力隨商業週期而變化。價值股（高帳面市值比）在經濟衰退期間對報酬率的預測更強，而動能在經濟擴張期間效果更好。這些時變關係在估計固定係數的標準線性模型中是不可見的。

馴服因子動物園

Feng、Giglio和Xiu的配套論文為機器學習在此環境中有效的原因提供了額外的理論基礎（Feng, Giglio & Xiu, 2020）。他們的框架解決了一個根本問題：面對400多個已提出的因子，如何確定哪些真正捕捉了風險，哪些只是雜訊？

傳統方法——對現有模型逐一測試因子——由於忽略了多重檢定問題而在統計上有缺陷。如果測試400個變數，大約20個將純粹因偶然而在5%水準上顯得顯著。

Feng、Giglio和Xiu提出了一種雙重選擇程序，使用機器學習（具體是LASSO）在控制其他因子的同時選擇重要因子。應用於150多個已發表因子後，他們發現絕大多數是冗餘的。在正確考慮多重檢定和因子間相關性後，只有少數因子存活。存活的因子——市場、規模、價值、動能、獲利能力及少數其他因子——與Gu、Kelly和Xiu的神經網路識別為重要的因子密切吻合。

這種收斂令人安心。神經網路並非在發現某種奇異的、不可解釋的訊號。它發現的是眾所周知的因子以線性模型遺漏的非線性方式交互作用。

實務意義

實務含義因投資者類型不同而有很大差異。

對於機構投資者和對沖基金，該論文驗證了量化策略向機器學習的轉變。樣本外收益足夠大，能夠承受能夠高效交易的投資組合的交易成本。幾家系統性對沖基金目前將基於神經網路的報酬率預測作為核心訊號。

對於散戶投資者，含義更加微妙。這些策略無法在家中複製。該論文使用了30,000檔股票的月度再平衡，這需要機構級別的執行基礎設施。多空組合還需要放空，這對散戶帳戶來說成本高昂，有時甚至不可能。

然而，這些發現對散戶投資者思考因子投資的方式有間接含義。如果真正的報酬生成過程是非線性的——如果動能在波動市場和平靜市場中表現不同，如果價值取決於商業週期——那麼簡單、固定的因子曝險只能捕獲可用溢價的一部分。這有助於解釋為什麼將固定規則應用於單一特徵的因子ETF經常跑輸其回測結果。真正的溢價來自機器學習方法能夠捕捉但固定規則無法捕捉的動態、條件性因子曝險。

局限性與未解決問題

該論文的優勢同時也是其局限。60年的樣本期（1957-2016）涵蓋了多個市場體制，有利於泛化。但以接近零的利率、前所未有的央行干預和被動投資崛起為特徵的最近十年可能代表了一個結構性斷裂。在1957-2016資料上訓練的模型在後疫情環境中可能無法達到同樣的表現。

儘管有謹慎的樣本外設計，過度擬合仍然是一個擔憂。作者使用滾動視窗方法定期重新訓練模型，但超參數（網路深度、正則化強度、學習率）的選擇仍然包含一些前瞻偏差。Kelly、Malamud和Zhou（2024）在後續論文中為複雜模型在高維環境中能夠真正超越而不僅僅是過度擬合提供了理論依據（Kelly, Malamud & Zhou, 2024）。

交易成本被承認但未完全納入。該論文報告的是成本前夏普比率，最有利可圖的策略涉及在實施成本最高的小型非流動股票中的大量交易。經過現實的交易成本調整後，神經網路相對於更簡單方法的優勢縮小，但並未消失。

最後，該論文僅關注美國股票。相同模式是否適用於國際市場、固定收益或其他資產類別仍是一個活躍的研究問題。國際研究的早期證據是有前景的，但並非決定性的。

更大的圖景

Gu、Kelly和Xiu的論文標誌著實證資產定價的一個轉折點。它證明了統計方法的選擇——線性與非線性、簡單與複雜——與預測變數的選擇同樣重要。幾十年來，資產定價研究在使用相同的線性迴歸工具包的同時專注於發現新變數。這篇論文表明，工具包本身才是瓶頸。

含義超越了報酬率預測。如果股票報酬率確實由非線性因子交互作用驅動，那麼主導學術和實務金融的標準因子模型——三因子、五因子和六因子模型——從根本上是錯誤設定的。它們捕捉了一階效應但遺漏了機器學習方法所利用的高階交互作用。

這並不意味著因子模型毫無用處。作為概念框架和風險歸因工具，它們仍然有價值。但作為預測工具，它們在桌面上留下了大量預測力。線性方法和非線性方法之間的差距是市場比標準模型假設的更為複雜的實證證據。

對於投資量化策略的每一個人——無論是透過對沖基金、智慧貝塔ETF還是自己的系統化方法——這篇論文的核心訊息是明確的：方法與資料同樣重要，最簡單的模型並不總是最好的模型。

本文僅供教育目的，不構成投資建議。過去的表現不保證未來的結果。

參考文獻

Gu, S., Kelly, B., & Xiu, D. (2020). Empirical Asset Pricing via Machine Learning. The Review of Financial Studies, 33(5), 2223-2273. https://doi.org/10.1093/rfs/hhaa009
Feng, G., Giglio, S., & Xiu, D. (2020). Taming the Factor Zoo: A Test of New Factors. The Journal of Finance, 75(3), 1327-1370. https://doi.org/10.1111/jofi.12883
Harvey, C. R., Liu, Y., & Zhu, H. (2016). ...and the Cross-Section of Expected Returns. The Review of Financial Studies, 29(1), 5-68. https://doi.org/10.1093/rfs/hhv059
Kelly, B., Malamud, S., & Zhou, K. (2024). The Virtue of Complexity in Return Prediction. The Journal of Finance, 79(1), 459-503. https://doi.org/10.1111/jofi.13298
Fama, E. F., & French, K. R. (2015). A Five-Factor Model of Expected Stock Returns. Journal of Financial Economics, 116(1), 1-22. https://doi.org/10.1016/j.jfineco.2014.10.010