統計套利：現代市場中的配對交易

核心要點

配對交易是最古老且最直觀的量化策略之一：找到兩檔同步運動的證券，等待價差擴大，然後押注價差收斂。Gatev、Goetzmann和Rouwenhorst(2006)利用簡單的距離法，在四十年的美國股票資料中記錄了約11%的年化報酬。然而，論文發表後獲利能力已大幅下降。現代從業者必須超越經典方法——採用共整合檢定、價差Z分數觸發訊號和機器學習選配——同時面對市場擁擠和交易速度加快壓縮了機會空間的現實。

什麼是配對交易？

配對交易是一種從兩檔相關證券的相對價格變動中獲利的市場中性策略。核心邏輯很簡單：如果兩檔股票歷史上一直同步運動並突然出現分歧，這種分歧很可能是暫時的。買入表現落後的一方，放空表現領先的一方，當價差收斂時獲利。

該策略由摩根士丹利的Nunzio Tartaglia量化團隊在1980年代中期率先開發。它成為華爾街最早被廣泛採用的系統性策略之一，至今仍是統計套利的基礎組成部分。

其吸引力在於市場中性。由於策略始終做多一檔證券並放空另一檔，對大盤走勢的曝險極小。

Gatev等人的研究：基礎性證據

2006年的里程碑式研究提供了配對交易最嚴格的學術檢驗。

距離法

在12個月的形成期內，計算美國股票全域中所有可能股票對的價格差平方和。選擇距離最小的20對用於交易。在隨後6個月的交易期內，當價差偏離歷史均值超過2個標準差時開倉。

關鍵結果

指標	數值
年化平均報酬	約11%（超過無風險利率）
每對交易平均報酬	持有期約1.3%
收斂時間中位數	約2個月
獲利配對比例	約65%
樣本期間	1962-2002

報酬在機構投資者典型交易成本水準下保持穩健，且無法用已知風險因子曝險解釋。

超越距離法：基於共整合的選配

距離法簡單但統計上不夠精確。Vidyamurthy(2004)等將共整合框架應用於配對交易。當兩個價格序列的線性組合是定態的——即使單個序列本身可能是非定態的——則它們具有共整合關係。

共整合方法

第一步：檢定。 使用Engle-Granger兩步法或Johansen檢定識別價差均值回歸的配對。

第二步：估計避險比率。 共整合迴歸產生避險比率(beta)。

第三步：建構價差。 價差定義為Price_A減去beta乘以Price_B。

第四步：交易規則。 將價差轉換為Z分數。

訊號	操作
Z分數 > +2.0	做空價差（放空A，做多B）
Z分數 < -2.0	做多價差（做多A，放空B）
Z分數穿越0	平倉（均值回歸完成）
Z分數 > +4.0	停損：平倉（關係可能已破裂）

獲利能力衰減

多項研究記錄了2000年代初以來配對交易獲利能力的顯著下降。

Do和Faff(2010, 2012)在延展資料上複製了Gatev方法論，發現2002年後報酬急劇下降。到2010年代，多項研究報告扣除現實交易成本後報酬接近零或為負。

原因已被充分理解：

市場效率提高。 隨著策略廣為人知，更多資本追逐相同機會，壓縮了價差。

電子交易。 從場內交易到電子交易的轉變減少了執行延遲。過去持續數天的價格錯位現在在數小時甚至數分鐘內修正。

高頻交易競爭。 HFT公司在毫秒級時間尺度上捕獲均值回歸模式，在較慢策略行動之前提取利潤。

相關性體制轉換。 2008年金融危機時許多配對同時脫離歷史關係，造成廣泛損失。

現代適應

機器學習選配

傳統方法檢視同一產業內的股票。現代方法使用非監督式學習技術——聚類演算法、基於特徵相似性的隨機森林——發現跨產業的非顯而易見的配對。透過供應鏈、共同因子曝險或共同所有權結構關聯的配對可能提供擁擠程度較低的機會。

動態避險比率

卡爾曼濾波技術允許避險比率持續更新，改善價差的定態性和交易訊號的時機。

多標的擴展

現代統計套利組合交易籃子而非單一配對：一檔股票對若干相關標的的加權組合。這降低了單一關係破裂帶來的特質風險。

實施注意事項

標的選擇。 聚焦於可放空且借券成本低的流動性大型股。

形成期。 距離法通常為12個月，共整合檢定為60至250個交易日的滾動窗口。

風險管理。 必須實施停損。配對交易最大的風險是歷史關係因併購、破產或根本性變化而永久破裂。

交易成本。 美國股票往返成本（佣金、買賣價差、放空成本）每筆交易20至50個基點，對獲利能力影響顯著。

模擬績效

考慮一個假設的10萬美元投資組合，從2005年1月至2025年12月，對S&P 500成分股應用基於共整合的配對交易策略。該策略在12個月形成期內識別共整合關係最強的20對，當價差Z分數超過2.0個標準差時開倉，在均值回歸或60個交易日後平倉。每對內保持美元中性。

假設條件：月度再平衡，往返交易成本20個基點，除非另有說明否則不使用槓桿，以S&P 500作為股票基準。

期間	策略報酬	基準報酬	最大回撤	夏普比率
2005–2007	+11.8% 年化	+8.6% 年化	-6.3%	0.95
2008（全球金融危機）	-18.4%	-37.0%	-24.7%	-0.72
2009–2012	+6.2% 年化	+12.8% 年化	-12.1%	0.48
2013–2016	+3.8% 年化	+11.2% 年化	-9.4%	0.30
2017–2019	+4.5% 年化	+12.4% 年化	-7.8%	0.36
2020（COVID）	-5.7%	+18.4%	-14.2%	-0.31
2021–2023	+5.4% 年化	+5.1% 年化	-8.6%	0.42
2024–2025	+4.1% 年化	+9.8% 年化	-6.9%	0.34
全部期間	+5.6% 年化	+9.7% 年化	-24.7%	0.44

模擬結果展示了充分記錄的獲利能力衰減。2007年之前的報酬強勁（年化11.8%），與Gatev、Goetzmann和Rouwenhorst(2006)的研究結果一致。2010年後的報酬壓縮至年化3-5%，反映了量化基金競爭加劇和電子交易加速價格發現。2008年危機中，相關性飆升，許多配對同時偏離，導致市場中性結構無法防禦的失敗模式和重大損失。

本模擬使用歷史資料，不代表實際交易結果。實際實施將面臨市場衝擊、買賣價差和營運限制等額外成本。

證據崩潰之時

2007年8月是統計套利的決定性危機。2007年8月6日至10日當週，股票市場中性量化基金遭受了歷史級別的同步損失。Khandani和Lo(2011)記錄了一個簡單均值回歸策略在僅四個交易日內損失了約25%的價值。其機制是強制拋售連鎖：一家面臨次貸部位虧損的大型多策略基金清算了其股票市場中性投資組合以籌集現金。由於許多量化基金持有類似的部位——基於類似訊號、應用於類似標的構建——強制拋售透過共享因子曝險傳播，導致那些與次貸毫無直接關聯的基金也遭受損失。據報導，高盛的Global Alpha基金在2007年8月損失了30%的價值。

該事件揭示了交易大量獨立配對所獲得的表面分散化是虛幻的。當數百家基金使用類似的共整合檢定、距離度量和因子模型構建投資組合時，所產生的部位之間的相關性遠高於單個配對層面的統計資料所暗示的程度。Khandani和Lo估計，擁擠因子——量化基金間部位重疊的程度——足以將一個局部流動性事件轉變為整個統計套利產業的系統性危機。

2008-2009年金融危機帶來了不同的挑戰：大規模的基本面關係斷裂。多年來展現穩定共整合的配對——如金融板塊股票、航空公司配對或汽車製造商——由於部分企業破產（雷曼兄弟、通用汽車）而永久性偏離，而它們之前相關的同業則倖存下來。存活企業與破產企業之間的價差擴大到任何歷史Z分數門檻都無法將其標記為交易機會的水準，因為基礎經濟關係已經不復存在。Do和Faff(2012)表明，其美國股票樣本中獲利配對的比例從1990年代的60%以上下降到2007年後的40%以下。

2010年5月6日的閃崩暴露了微觀結構脆弱性。在20分鐘的暴跌期間，流動性不對稱蒸發導致許多配對偏離——配對的一端可能繼續交易，而另一端則停牌或變得缺乏流動性。依賴兩端同步執行的策略發現自己承受了未對沖的方向性曝險，而這恰恰是市場中性結構旨在消除的風險。

研究共識的啟示

學術文獻在幾個關鍵點上達成了明確共識。第一，配對交易在Gatev、Goetzmann和Rouwenhorst(2006)記錄的時期內確實是獲利的，其報酬無法用已知風險因子解釋。第二，論文發表後獲利能力大幅下降，這一發現得到了Do和Faff(2010, 2012)、Broussard和Vaihekoski(2012)以及Jacobs和Weber(2015)的證實。這種衰減與McLean和Pontiff(2016)記錄的更廣泛模式一致——他們證明交易策略報酬在學術發表後約下降35%，因為資本湧向已記錄的機會。

爭議持續存在的領域是該策略對於精明的從業者是否仍然可行。Avellaneda和Lee(2010)證明了多因子統計套利——使用主成分分析或產業ETF將報酬分解為系統性和特質性成分——即使在論文發表後的時期也大幅跑贏簡單配對交易。Krauss(2017)在對統計套利機器學習方法的全面綜述中發現，深度學習模型在配對選擇和訊號生成方面能夠恢復大部分失去的alpha，儘管這些方法需要大量運算基礎設施。

Cummins和Bucca(2012)以及Rad、Low和Faff(2016)所闡述的新興共識認為，統計套利已從一個中等精明投資者也可參與的容量充裕策略，轉變為一個容量受限、基礎設施密集型的業務，其報酬主要歸屬於擁有執行優勢的參與者：更低的延遲、更好的資料、更精密的模型和更低的交易成本。對於更廣泛的投資群體而言，實際啟示是：沒有在執行和訊號生成方面的顯著競爭優勢，簡單配對交易不太可能產生有意義的風險調整報酬。

參考文獻

Avellaneda, M., & Lee, J.-H. (2010). "Statistical Arbitrage in the US Equities Market." Quantitative Finance, 10(7), 761-782. https://doi.org/10.1080/14697680903124632
Do, B., & Faff, R. (2010). "Does Simple Pairs Trading Still Work?" Financial Analysts Journal, 66(4), 83-95. https://doi.org/10.2469/faj.v66.n4.1
Gatev, E., Goetzmann, W. N., & Rouwenhorst, K. G. (2006). "Pairs Trading: Performance of a Relative-Value Arbitrage Rule." The Review of Financial Studies, 19(3), 797-827. https://doi.org/10.1093/rfs/hhj020
Khandani, A. E., & Lo, A. W. (2011). "What Happened to the Quants in August 2007? Evidence from Factors and Transactions Data." Journal of Financial Markets, 14(1), 1-46. https://doi.org/10.1016/j.finmar.2010.08.003
McLean, R. D., & Pontiff, J. (2016). "Does Academic Research Destroy Stock Return Predictability?" The Journal of Finance, 71(1), 5-32. https://doi.org/10.1111/jofi.12365