什麼是主成分分析，為什麼在金融中使用？

主成分分析（PCA）是一種統計技術，將資產報酬的共變異數矩陣分解為特徵值和特徵向量，提取解釋最多變異的不相關因子。在金融中，它用於在不施加經濟假設的情況下識別報酬的隱藏驅動因素。對於殖利率曲線，PCA揭示了解釋95%以上變動的三個因子（水準、斜率、曲率）。對於股票，它從報酬共變異數中提取主導風格因子。PCA還是Ledoit-Wolf收縮估計等共變異數矩陣清洗技術的基礎，通過減少估計雜訊來改善投資組合最適化。

解釋殖利率曲線變動需要多少個主成分？

正如Litterman和Scheinkman（1991）所示，僅三個主成分就解釋了殖利率曲線變動的95-98%。第一個成分（水準）解釋83-90%，代表所有殖利率的平行移動。第二個（斜率）解釋6-10%，捕捉曲線變陡或變平。第三個（曲率）解釋1-3%，代表短期和長期利率相對於中期利率的蝶式運動。這種顯著的簡約性意味著數十個不同到期殖利率看似複雜的行為僅由三個基礎力量驅動。

什麼是Ledoit-Wolf收縮估計，它如何改善投資組合最適化？

Ledoit-Wolf收縮估計（2004）解決了當資產數量相對於觀測數量較大時樣本共變異數矩陣變得極度嘈雜的問題。該方法將資訊豐富但嘈雜的樣本共變異數矩陣與更簡單、更穩定的結構化目標（如常數相關矩陣）混合。最適混合強度通過分析方法確定，以最小化預期樣本外估計誤差。在實務中，這產生了更穩定、更分散化的投資組合權重，與使用原始樣本共變異數矩陣最適化的投資組合相比，樣本外投資組合變異數降低10-30%。

金融中的主成分分析：什麼驅動報酬？

核心要點

螢幕上的金融數據分析

主成分分析從共變異數矩陣中直接提取驅動資產報酬的隱藏因子，無需將經濟理論作為預設輸入。在固定收益領域，Litterman和Scheinkman（1991）證明僅三個主成分（被解釋為水準、斜率和曲率）就能解釋殖利率曲線變動的約98%。在股票市場，PCA揭示了嵌入在報酬共變異數中的主導風格因子，Ledoit和Wolf（2004）證明將樣本共變異數矩陣向結構化目標收縮能顯著改善樣本外投資組合表現。PCA不是黑箱，它是向數據詢問市場驅動力的最透明方式。

金融中的維度問題

金融市場產生數千個相關的報酬時間序列。追蹤500檔股票的投資組合經理觀察到500個獨立的報酬流，但真正獨立的風險來源數量遠少於此。這500檔股票的大部分變動可以由少數共同因子解釋：整體市場、利率、產業輪動以及幾個風格傾斜。

挑戰在於如何在不預設這些因子應該是什麼的前提下識別它們。Fama-French等傳統因子模型從經濟假設（價值、規模、獲利能力）出發，然後檢驗它們是否解釋報酬。PCA採取相反的方法。它從報酬的共變異數矩陣出發，提取最大變異的方向，讓數據自行揭示其結構。

這一區別至關重要。當真正的因子結構未知，或目標是為投資組合最適化清洗共變異數矩陣中的雜訊時，PCA是正確的起點。

PCA的工作原理：機制

PCA將資產報酬的共變異數矩陣分解為特徵值和特徵向量。每個特徵向量定義一個投資組合（原始資產的線性組合），其對應的特徵值衡量該投資組合解釋的報酬變異大小。特徵向量是正交的，這意味著因子在構造上是不相關的。

程序很直接。給定一個T x N的報酬矩陣（T個時間段，N個資產），計算N x N的樣本共變異數矩陣。進行特徵分解獲得N個特徵值-特徵向量對。按特徵值降序排列。第一主成分（PC1）是與最大特徵值相關的特徵向量；它是捕獲所有N個資產中最多變異的單一投資組合。PC2捕獲與PC1正交的最多剩餘變異，依此類推。

第k個主成分解釋的總變異比例是其特徵值除以所有特徵值之和。在實務中，少數PC通常解釋絕大部分變動，其餘成分是雜訊。

Litterman和Scheinkman（1991）：支配殖利率曲線的三個因子

PCA在金融中的里程碑式應用是Litterman and Scheinkman (1991)。他們將PCA應用於各到期日美國國債殖利率變化的共變異數矩陣，發現三個因子幾乎解釋了所有的殖利率曲線運動。

第一主成分（PC1）是所有到期日大致等權重的組合。當該因子變動時，所有殖利率一起上升或下降。它被解釋為水準因子，根據樣本期間的不同，解釋總殖利率曲線變動的約83%至90%。

第二主成分（PC2）在短到期日上有正載荷，在長到期日上有負載荷（或反之）。當該因子變動時，殖利率曲線變陡或變平。這是斜率因子，解釋約6%至10%的變動。

第三主成分（PC3）在短期和長到期日上有正載荷，在中到期日上有負載荷，形成「蝶式」形狀。這是曲率因子，解釋約1%至3%的變動。

這三個因子合計解釋了所有殖利率曲線運動的95%至98%，其餘成分中只留下殘差雜訊。

主成分	解釋	解釋變異（%）	特徵向量載荷模式
PC1	水準	83-90	所有到期日均勻正值
PC2	斜率	6-10	短期正、長期負（或反之）
PC3	曲率	1-3	短期+長期正，中期負
PC4-PCN	雜訊	2-5（合計）	無穩定的經濟學解釋

這三個特徵向量的載荷模式在數十年間以及全球各國主權殖利率曲線中都表現出驚人的穩定性。Diebold and Li (2006)後來證明，這三個因子與殖利率曲線的Nelson-Siegel參數模型密切對應，其中水準、斜率和曲率被建模為時變潛在因子。

特徵向量載荷：每個因子的形態

特徵向量載荷揭示了每個到期日如何貢獻於每個主成分。下表展示了美國國債數據的代表性載荷。

到期日	PC1（水準）	PC2（斜率）	PC3（曲率）
3個月	0.25	0.58	0.55
1年	0.30	0.42	0.10
2年	0.34	0.28	-0.30
5年	0.38	-0.05	-0.55
10年	0.40	-0.33	-0.15
20年	0.42	-0.42	0.20
30年	0.43	-0.45	0.45

PC1載荷近乎均勻，證實了水準的解釋。PC2載荷從短到期日的正值單調遞減至長到期日的負值，捕捉斜率。PC3載荷在兩端為正、中間為負，形成U形，捕捉曲率。這些模式不是預設的，而是直接從數據的特徵分解中浮現出來的。

股票中的PCA：提取風格因子

在股票市場，將PCA應用於股票報酬共變異數矩陣可以揭示共同運動的主導來源。Connor and Korajczyk (1986)引入了用於估計大截面中統計因子模型的漸近主成分方法。他們的方法通過從T x T交叉乘積矩陣而非N x N共變異數矩陣中提取因子，來處理資產數超過時間期數的情況。

股票報酬的第一主成分幾乎總是市場因子；它捕捉所有股票一起運動的廣泛趨勢。後續成分通常與公認的風格因子一致：價值對成長、規模、動能和波動率。

Menchero (2011)展示了如何將PCA衍生的因子映射到商業股票風險模型中經濟上可解釋的風險因子。關鍵洞察是統計PCA因子和基本面因子模型不是競爭框架，而是互補的。PCA在不命名的情況下識別風險的主導方向；基本面模型提供經濟標籤，使投資組合經理能夠對特定曝險持有觀點。

廣泛股票宇宙的典型PCA分解顯示，前5至10個主成分解釋總報酬變異的50%至70%，僅第一個成分（市場）就解釋25%至40%。這與殖利率曲線三個因子解釋95%以上的情況有顯著不同。這一差異反映了股票更豐富、更異質的因子結構。

資產類別	50%變異所需PC數	90%變異所需PC數	PC1單獨（%）
美國國債殖利率	1	3	83-90
美國大型股	1	50-80	25-40
全球主權債	1-2	5-8	60-75
大宗商品	2-3	10-15	20-35

共變異數矩陣清洗：Ledoit-Wolf收縮估計

當資產數量相對於時間期數較大時，樣本共變異數矩陣是一個糟糕的估計量。對於在250個交易日內觀測500檔股票的情況，樣本共變異數矩陣從僅125,000個數據點中估計124,750個唯一條目。結果矩陣雜訊大、不穩定，產生過度擬合於估計誤差的投資組合。

Ledoit and Wolf (2004)提出了基於PCA思想的解決方案：將樣本共變異數矩陣向結構化目標收縮。他們的方法將資訊豐富但雜訊大的樣本共變異數矩陣與更簡單、有偏但穩定的目標（如單因子模型共變異數矩陣或常數相關矩陣）混合。最適收縮強度通過分析方法確定，以最小化預期樣本外損失。

與PCA的聯繫是直接的。樣本共變異數矩陣的不穩定性來自於被估計雜訊主導的最小特徵值。基於PCA的清洗涉及截斷或收縮小特徵值，同時保留大特徵值。Ledoit-Wolf收縮通過不同的機制實現類似效果：它將所有特徵值拉向均值，將雜訊大的小特徵值向上壓縮，將可能被高估的大特徵值向下壓縮。

在樣本外測試中，與使用原始樣本共變異數矩陣相比，Ledoit-Wolf收縮將投資組合變異降低了10%至30%。當資產與時間期數之比較高時（即「維度詛咒」最為嚴重時），改善效果最大。

隨機矩陣理論：分離訊號與雜訊

Marcenko and Pastur (1967)為PCA中區分真實因子與雜訊提供了理論基礎。如果資產報酬確實由無共同因子的純雜訊驅動，樣本共變異數矩陣的特徵值將遵循具有已知邊界的特定分配。超過該分配上界的任何特徵值都可能反映真實因子而非估計雜訊。

Marcenko-Pastur分配取決於兩個參數：資產與時間期數之比（q = N/T）和雜訊變異。對於具有500檔股票和1,000個日度觀測值的典型股票數據集，q = 0.5，雜訊特徵值分配的上界約為雜訊變異的2.9倍。超過此閾值的特徵值作為訊號保留；低於此閾值的特徵值被截斷或替換為平均值。

這種共變異數清洗方法已成為量化資產管理的標準做法。它為確定保留多少主成分提供了一種有原則的、非隨意的方法。

實際實施注意事項

PCA需要若干影響結果的實施選擇。

首先，輸入數據必須標準化。如果報酬沒有去均值和縮放，PCA將被變異最高的資產而非最系統性的共同運動所主導。在股票應用中，使用相關矩陣（標準化共變異數）而非原始共變異數矩陣是標準做法。

其次，估計窗口很重要。較長的窗口提供更穩定的估計，但可能錯過制度變化。較短的窗口捕捉演變中的因子結構，但引入更多雜訊。60至252個交易日的滾動PCA是常見的折衷方案。

第三，特徵向量符號是任意的。PCA定義方向而非符號；PC1可以在所有資產上有正或負載荷。實務者通常按慣例固定符號（例如要求PC1在整體市場上有正載荷）。

第四，PCA因子不能直接交易。將PCA特徵向量轉換為可交易的投資組合需要將其投影到實際證券上，並管理放空、交易成本和再平衡的實際約束。

局限性

PCA是線性方法。它無法捕捉資產間的非線性依賴關係。在制度轉換、波動率聚集或非對稱尾部依賴重要的市場中，PCA可能遺漏報酬生成過程的關鍵特徵。

PCA因子缺乏固有的經濟學解釋。特徵向量是統計產物；將PC1標記為「市場」或PC2標記為「價值」是事後解釋，在不同時期或市場制度下可能不成立。

PCA對異常值敏感。僅一天的極端報酬就可能扭曲共變異數矩陣並移動主成分。穩健PCA方法存在但增加了複雜性。

最後，PCA假設平穩性。因子結構和因子載荷被假定在估計窗口內是恆定的。在實務中，因子結構會演變，解釋去年報酬的載荷可能無法解釋明年的報酬。

參考文獻

Litterman, R., & Scheinkman, J. (1991). "Common Factors Affecting Bond Returns." Journal of Fixed Income, 1(1), 54-61. https://doi.org/10.3905/jpm.1991.409331
Connor, G., & Korajczyk, R. A. (1986). "Performance Measurement with the Arbitrage Pricing Theory: A New Framework for Analysis." Journal of Financial Economics, 15(3), 373-394. https://doi.org/10.1016/0304-405X(86)90011-4
Ledoit, O., & Wolf, M. (2004). "A Well-Conditioned Estimator for Large-Dimensional Covariance Matrices." Journal of Multivariate Analysis, 88(2), 365-411. https://doi.org/10.1016/j.jempfin.2003.10.003
Menchero, J. (2011). "Characteristics of Factor Portfolios." Journal of Portfolio Management, 37(4), 125-132. https://doi.org/10.3905/jpm.2011.37.4.125
Marcenko, V. A., & Pastur, L. A. (1967). "Distribution of Eigenvalues for Some Sets of Random Matrices." Mathematics of the USSR-Sbornik, 1(4), 457-483. https://doi.org/10.1070/SM1967v001n04ABEH001994
Diebold, F. X., & Li, C. (2006). "Forecasting the Term Structure of Government Bond Yields." Journal of Econometrics, 130(2), 337-364. https://doi.org/10.1016/j.jeconom.2005.03.005