金融中最古老的交易
均值回归的直觉早于现代金融理论数个世纪。早在19世纪,大卫·李嘉图就建议交易者"迅速止损,让利润奔跑",但逆向本能——买入下跌的资产、卖出上涨的资产——在更早的大宗商品市场中就有记载。1637年荷兰郁金香泡沫崩溃中幸存的交易者之所以能幸免于难,是因为他们意识到价格已经偏离内在价值太远。学术文献此后将这种古老冲动背后的统计结构加以形式化:回归可靠的条件、驱动回归的机制,以及将理论利润与实际利润区分开来的交易成本。
核心要点
均值回归是资产价格、估值和利差随时间向长期均值回归的经验性趋势。虽然这个概念听起来简单,但实施盈利的均值回归策略需要仔细关注回归发生的时间范围、用于检测回归的统计工具以及可能侵蚀理论利润的交易成本。从Poterba和Summers(1988)到Avellaneda和Lee(2010)的学术文献为理解价格何时以及为什么回弹提供了丰富的基础,但也警告均值回归既非普遍存在也非有保证的。本文将介绍在现代市场中构建均值回归策略的证据、机制和实际考量。
什么是均值回归?
均值回归是指偏离长期均值的变量在随后的时期内趋向于向该均值移动的统计属性。在金融领域,这个概念适用于多个层面。个股价格在极端波动后可能回归。市盈率(P/E)等估值指标倾向于围绕长期标准波动。公司债与国债之间的收益率利差在危机时扩大,然后随着条件正常化而收缩。
数学上,均值回归最简单的模型是奥恩斯坦-乌伦贝克(OU)过程,这是一个连续时间随机过程,定义为dX(t) = theta * (mu - X(t)) * dt + sigma * dW(t)。其中,mu是长期均值,theta是回归速度(值越大回拉越快),sigma是波动率,W(t)是维纳过程。OU过程是量化金融的基础构建模块,用于利率模型(Vasicek 1977)、商品定价和配对交易框架。
区分均值回归和平稳性很重要。平稳过程具有恒定的均值和方差,而均值回归仅意味着趋向于回到某个中心值的倾向。资产价格本身通常是非平稳的(长期呈上升趋势),但相关资产之间的价差、估值比率和波动率指标通常表现出均值回归行为。
这个概念也与赌徒谬误不同。均值回归并不意味着下跌的股票必须上涨。相反,它暗示公允价值的极端偏离会创造出反转概率在统计上升高的条件。这种区别虽然微妙,但对策略设计至关重要。
长期证据
长期均值回归的学术论据始于Poterba和Summers(1988)发表在Journal of Financial Economics上的里程碑式研究。他们考察了1871年至1986年的美国股票回报,发现在三到五年的时间范围内存在显著的负序列相关性。简而言之,高于平均回报的时期之后往往跟随低于平均回报的时期,反之亦然。他们的方差比检验表明,多年回报的方差增长慢于随机游走下的预期,这是均值回归行为的标志。
Fama和French(1988)在同年发表于Journal of Financial Economics的研究中得出了互补性结论。他们记录了三到五年股票回报变动的25%至40%可以由初始股息收益率预测,这与价格中的均值回归成分一致。当股息收益率高时(价格相对于股息较低),随后多年的回报往往高于平均水平。
然而,长期证据并非没有争议。包括Richardson和Stock(1989)在内的批评者指出,长期检验存在严重的小样本问题。在一个世纪的数据中只有少数不重叠的五年期间,统计检验力有限。Cochrane(2008)更近的研究认为,虽然可预测性发现在统计上是脆弱的,但在经济上是有意义的,并且与时变风险溢价一致。
国际证据普遍支持均值回归假说。Balvers、Wu和Gilliland(2000)考察了1969年至1996年18个发达国家股票市场,发现实际股价指数中存在统计显著的均值回归,半衰期约为三到三年半。这意味着长期趋势的任何偏离约有一半在此时间框架内得到修正。
短期反转
虽然长期证据跨越数年,但另一个独立的、可能更具可操作性的研究体系记录了在更短时间范围内的均值回归。Jegadeesh(1990)在其发表于Journal of Finance的有影响力的论文中发现,月度股票回报表现出显著的负序列相关性。在过去一个月表现不佳的股票倾向于在随后一个月表现优异,而近期赢家则倾向于表现不佳。
Lehmann(1990)将时间范围推得更短,记录了美国股票中显著的周度回报反转。买入前一周输家并卖出前一周赢家的投资组合在交易成本前产生了每周约1.5%的经济上显著的利润。
关键问题是这些短期反转是否代表真正的盈利机会,还是仅仅是提供流动性的补偿。Lo和MacKinlay(1990)认为短期反转的很大一部分可以归因于买卖价差弹跳和对共同因子的延迟调整,而非基本价值的真正均值回归。Avramov、Chordia和Goyal(2006)进一步证明,在考虑了包括买卖价差和价格冲击在内的交易成本后,短期反转策略的盈利能力大部分消失了,尤其是对于规模较小和流动性较低的股票。
尽管如此,最近的研究表明,短期反转策略的精细实施仍然可以保持盈利。Nagel(2012)将反转利润与提供流动性的回报联系起来,表明这些回报在流动性稀缺的市场压力期间最高。这种解释将短期均值回归框架为非免费午餐,而是在动荡时期承担库存风险的补偿。
均值回归背后的机制
理解价格为什么回归对于构建稳健的策略至关重要。学术文献中提出了几种机制,每种对策略设计都有不同的启示。
| 机制 | 描述 | 策略启示 |
|---|---|---|
| 过度反应 | 投资者系统性地对新闻过度反应,将价格推得过远后发生修正(De Bondt and Thaler 1985) | 在3-5年时间范围内买入过去输家的逆向策略 |
| 流动性驱动的错位 | 大型机构交易暂时将价格推离均衡;冲击消散后价格回归(Grossman and Miller 1988) | 在最具流动性的市场中、可识别的流动性事件后回归最快 |
| 时变风险溢价 | 危机期间风险厌恶上升推高要求回报并压低价格;正常化推动恢复 | 均值回归是承担风险的补偿,而非市场无效率 |
| 结构性联系 | 相关证券(同一行业、股票vs.行业ETF)共享共同基本面驱动因素,拉回分化的价格 | 配对交易和基于价差策略的理论基础 |
配对交易与统计套利
配对交易由摩根士丹利的Nunzio Tartaglia量化团队在1980年代中期首次系统性地开发,可能是均值回归最著名的实际应用。基本思想是识别历史上一起移动的两种证券,等待价格偏离超过阈值,然后对表现不佳者建立多头头寸,对表现优异者建立空头头寸。当两种证券之间的价差收敛回历史常态时实现利润。
Gatev、Goetzmann和Rouwenhorst(2006)在Review of Financial Studies上发表的研究中提供了配对交易最全面的学术分析之一。使用1962年至2002年的美国股票数据,他们发现基于最小距离的简单配对交易策略(选择在形成期间标准化价格序列的平方偏差之和最小的配对)在考虑一天交易延迟后,产生了约11%的年化超额回报,夏普比率约为0.55。
Avellaneda和Lee(2010)将配对交易概念扩展到更广泛的统计套利框架中。他们发表在Quantitative Finance上的方法不是交易单个配对,而是将股票回报分解为系统性成分(由行业ETF或主成分解释)和特异性残差。然后他们将特异性残差建模为均值回归的OU过程,并根据这些残差的信号构建同时交易多只股票的投资组合。他们对1997年至2007年美国股票的回测显示年化夏普比率超过1.0,显著优于简单的配对交易。
然而,多项研究记录了配对交易盈利能力随时间下降的趋势。Do和Faff(2010)表明,基本的Gatev-Goetzmann-Rouwenhorst配对交易策略的回报在2002年后大幅下降,这可能是由于量化对冲基金竞争加剧和市场效率提高。这种盈利能力的衰减是量化策略的共同主题,突显了持续创新的重要性。
均值回归与动量
一个自然的问题是均值回归与动量——近期赢家继续表现优异、近期输家继续表现不佳的倾向——之间的关系。这种关系比简单的对立更为微妙。
Jegadeesh和Titman(1993)记录了动量在3至12个月的中期时间范围内最强,De Bondt和Thaler(1985)表明在3至5年的长期时间范围内回归占主导地位,Jegadeesh(1990)和Lehmann(1990)发现在1周至1个月的非常短期时间范围内存在反转。这种模式暗示了三体制结构。
| 体制 | 时间范围 | 主导机制 |
|---|---|---|
| 短期反转 | 1周 – 1个月 | 流动性提供和微观结构效应 |
| 中期动量 | 3 – 12个月 | 信息的逐步扩散和投资者对盈利消息的反应不足 |
| 长期回归 | 3 – 5年 | 累积过度反应的修正和估值比率的均值回归 |
对投资组合构建的启示是,动量和均值回归策略可以互补。因为它们往往呈负相关(动量买入近期赢家,而短期反转卖出它们),将它们结合可以产生更稳定的回报流。Asness、Moskowitz和Pedersen(2013)记录了多个资产类别中的这种负相关性,并认为组合策略相比任一单独方法提供了更优的风险调整后回报。
实际实施
在实践中实施均值回归策略需要解决几个可能决定理论盈利与实际亏损之间差异的挑战。
第一个挑战是信号构建。如何衡量偏离均值的选择至关重要。简单方法使用基于滚动窗口的z分数(例如,当前价格减去60日移动平均线,除以滚动标准差)。更复杂的方法使用卡尔曼滤波器动态估计均值和回归速度,或使用基于协整的方法(Engle and Granger 1987)来识别证券之间稳定的长期关系。增强型迪基-福勒检验和菲利普斯-佩龙检验通常用于检验价差是否平稳——这是均值回归交易的必要条件。
第二个挑战是交易成本。均值回归策略,特别是短期的策略,倾向于频繁交易。每笔交易都会产生买卖价差、市场冲击、佣金和滑点的成本。Khandani和Lo(2007)证明,即使交易成本的微小增加也会急剧降低高频均值回归策略的盈利能力。成功的从业者因此在执行基础设施上进行大量投资,包括智能订单路由、算法执行和主机托管,以最小化这些成本。
第三个挑战是风险管理。均值回归策略面临回归永远不会发生的风险。超出历史常态的价差如果基础经济关系已经改变,可能继续扩大。这被称为价差发散风险,在2007-2008年金融危机期间得到了痛苦的印证,当时许多配对交易和统计套利策略因相关性崩溃而遭受严重损失。头寸规模控制、止损规则和跨多个独立赌注的分散化是必不可少的保障措施。
第四个挑战是体制识别。均值回归在区间震荡的稳定市场中运作良好,但在趋势性或结构性变化的环境中可能灾难性地失败。从业者通常使用体制转换模型(Hamilton 1989)或均值回归速度参数的动态估计来调整策略的激进程度。当估计的回归速度降至阈值以下时,减少头寸规模或完全暂停交易可以保存资本。
最后,容量限制值得关注。因为均值回归策略,特别是股票中的策略,通常涉及交易流动性较低的标的和持有逆向头寸,它们面临在不将价格推向不利方向的情况下能够部署的资本的自然限制。Avellaneda和Lee(2010)指出,他们的统计套利回报集中在小盘股和流动性较低的股票中,而这恰恰是容量最受限的部分。随着管理资产的增长,预期回报倾向于下降,这是一种被称为阿尔法衰减的现象,几乎影响所有量化策略。
模拟业绩
考虑一个假设性的10万美元投资组合,从2005年1月至2025年12月对标普500成分股应用简单的股票均值回归策略。该策略按60日z值对股票进行排名,买入底部十分位(最超卖)并做空顶部十分位(最超买),每月再平衡。每条腿内的头寸为等权重。
假设条件:每月再平衡,往返交易成本20个基点,除非特别说明否则不使用杠杆,标普500作为股票基准。
| 期间 | 策略收益率 | 基准收益率 | 最大回撤 | 夏普比率 |
|---|---|---|---|---|
| 2005–2007 | +9.2% 年化 | +8.6% 年化 | -7.1% | 0.62 |
| 2008(全球金融危机) | -14.8% | -37.0% | -22.3% | -0.41 |
| 2009–2012 | +7.4% 年化 | +12.8% 年化 | -11.5% | 0.48 |
| 2013–2016 | +4.1% 年化 | +11.2% 年化 | -9.8% | 0.31 |
| 2017–2019 | +5.8% 年化 | +12.4% 年化 | -8.2% | 0.44 |
| 2020(新冠疫情) | -6.2% | +18.4% | -19.7% | -0.28 |
| 2021–2023 | +7.9% 年化 | +5.1% 年化 | -10.4% | 0.55 |
| 2024–2025 | +6.5% 年化 | +9.8% 年化 | -7.6% | 0.49 |
| 全部期间 | +6.3% 年化 | +9.7% 年化 | -22.3% | 0.47 |
该模拟呈现出几个明显的模式。策略在强劲的趋势性牛市中(2013-2016、2017-2019)跑输基准,这与学术研究发现的均值回归在动量驱动环境中表现不佳一致。2008年危机期间,市场中性结构提供了部分保护,损失14.8%,而基准下跌了37%,但随着相关性飙升和利差扩大超出历史范围,策略仍然遭受了损失。2020年后的复苏期显示出相对强势,因为疫情驱动的价格错位创造了有利可图的回归机会。
此模拟使用历史数据,不代表实际交易结果。实际实施将面临包括市场冲击、买卖价差和运营限制在内的额外成本。
当证据失效时
2007年夏季提供了现代市场中均值回归失败的最戏剧性案例。2007年8月6日至10日那一周,一批量化股票基金在几天内同时损失了5%至30%。Khandani和Lo(2011)详细记录了这次"量化地震",表明损失源于杠杆化股票市场中性头寸的快速平仓——其中许多依赖于均值回归信号。机制是强制去杠杆连锁反应:一家大型基金(被广泛认为是某大型银行的多策略部门)为满足次贷敞口的追加保证金而清算股票头寸,暂时将价格推离基本面价值。持有类似头寸的其他量化基金蒙受损失,触发了自身的风险限额,形成自我强化的螺旋下降。
该事件暴露了均值回归策略的结构性弱点:拥挤。当许多基金交易类似信号时,其集体头寸成为系统性风险的来源。市场某一部分的流动性冲击可以通过拥挤策略的共享因子敞口传导,导致在模型预测收敛的恰好时刻产生损失。
2020年新冠疫情暴跌展示了不同的失败模式。2020年3月,标普500在23个交易日内下跌34%,是有记录以来最快的跌幅之一。随着股票跌破历史z值阈值,均值回归信号产生了激进的买入信号,但价格在反转前继续下跌数周。提前买入的策略在复苏开始前遭受了严重的按市值计价损失。Nagel和Zheng(2022)分析了这一事件,发现作为短期反转利润核心经济功能的流动性提供在暴跌初期变得极为昂贵,因为买卖价差扩大到正常水平的数倍,市场深度蒸发。
2015-2016年期间展示了一种更缓慢但同样具有破坏性的失败模式:体制转变。多年来表现出稳定协整关系的能源板块配对因页岩革命重塑竞争格局而永久性崩溃。依赖石油服务配对历史价差关系的交易者看到价差扩大且永远不会收敛,因为配对公司之间的基本经济关系已经永久改变。Israel和Moskowitz(2013)记录了这种结构性断裂是金融市场的持续特征,代表了任何均值回归框架中不可约减的风险。
研究共识的启示
学术文献在均值回归方面存在几点广泛共识。第一,均值回归行为是资产价格在多个时间范围内的真实且持续的特征,这一点从Poterba和Summers(1988)到Balvers、Wu和Gilliland(2000)都得到了支持,并在国际数据中得到确认。第二,Jegadeesh(1990)和Lehmann(1990)记录的短期反转效应在经济上具有显著性,但正如Nagel(2012)所证明的,它主要代表的是提供流动性的补偿,而非纯粹的无效率。
文献存在分歧的地方在于利润的来源和可持续性。Gatev、Goetzmann和Rouwenhorst(2006)报告了截至2002年配对交易的强劲回报,但Do和Faff(2010、2012)记录了研究发表后盈利能力的显著衰退,表明研究的发表本身加速了竞争。Avellaneda和Lee(2010)表明更精密的统计套利方法可以恢复大部分失去的盈利能力,但他们的方法需要大多数投资者无法获得的大量基础设施和因子模型支持。
Chordia、Goyal和Saretto(2020)阐述的日益增长的共识认为,现代市场中均值回归利润主要流向具有执行优势的参与者——更低的延迟、更好的数据、更低的交易成本——而非具有卓越信号构建能力的参与者。这一发现具有实际意义:零售和小型机构投资者可能发现长期基于估值的均值回归(在多年时间范围内买入便宜市场、卖出昂贵市场)比已经成为基础设施密集型业务的短期统计套利更具可及性。
实际启示是,均值回归作为投资组合构建原则仍然有效,特别是作为动量策略的补充(Asness、Moskowitz和Pedersen 2013),但具体实施必须根据投资者的执行能力、时间范围和容量限制进行校准。