核心要点
因子投资是一种系统性地追求通过数十年学术研究所确定的特定、持续性收益驱动因素的实践。因子投资者不是基于主观判断选择个别证券,而是构建向价值、动量、质量、低波动率和规模等特征倾斜的投资组合——这些特征在多个市场和时间段历史上都获得了超额回报。其知识基础建立在Fama和French(1992、1993)、Jegadeesh和Titman(1993)、Ang(2014)等人的研究之上。然而,Harvey、Liu和Zhu(2016)在学术文献中编目了400多个因子,这种已发表因子的爆炸式增长造成了需要严格审查的"因子动物园"问题。本入门指南解释了什么是因子、哪些经受住了仔细测试、为什么它们可能获得溢价,以及从业者如何将它们组合成稳健的多因子组合。
什么是因子?
在资产定价的背景下,因子是系统性解释证券间预期回报差异的变量。这个概念源于Sharpe(1964)和Lintner(1965)的资本资产定价模型(CAPM),该模型假设单一因子——市场组合——解释预期回报的截面。股票的预期回报由其对市场的贝塔(敏感性)决定:较高贝塔的股票应获得更高的回报,作为承担更多系统性风险的补偿。
CAPM的实证失败推动了对额外因子的搜索。Fama和French(1992)证明了两个变量——公司规模(市值)和账面市值比(价值的衡量)——解释了市场贝塔单独无法解释的股票回报截面变动的很大一部分。他们随后1993年的论文引入了三因子模型,在市场因子之上增加了SMB(小减大)和HML(高减低账面市值比)因子。该模型在二十多年里成为实证资产定价的主力工具。
因子可以在两个层面理解。在特征层面,它是证券的可测量属性,如市净率、近期回报或盈利波动性。在组合层面,因子通常以多空组合的形式实施:做多具有高因子暴露的股票,做空具有低暴露的股票。这个多空组合的回报就是因子回报,代表承担相关风险或利用相关异象所获得的溢价。
一个因子要被认为可信,理想情况下应满足Ang(2014)和Kozak、Nagel、Santosh(2018)等研究者提出的几个标准。它应有解释溢价存在原因的强经济理由。经过多重检验调整后应保持统计稳健。应在不同时间段、地理区域和资产类别中持续存在。并应经受住交易成本和实际实施约束的考验。
因子动物园问题
Harvey、Liu和Zhu(2016)在Review of Financial Studies上发表的标志性论文中记录了至少316个(后来更新为400多个)因子已在顶级金融期刊上发表。这种急剧增加引发了对数据挖掘和多重检验偏差的严重担忧。当数百名研究人员检查同一数据集寻找回报的显著预测变量时,即使不存在真实关系,一些人也会纯粹因为偶然而发现统计显著的结果。
金融中统计显著性的标准阈值是t统计量2.0,对应大约0.05的p值。Harvey、Liu和Zhu认为,考虑到已测试的因子数量,需要更高的阈值。他们提议使用3.0或更高的t统计量截断值。应用这个更严格的标准,他们估计大约一半的已发表因子将无法达到显著性。
McLean和Pontiff(2016)提供了因子研究中发表偏差的直接证据。他们检查了学术期刊中记录的97个因子,发现平均因子回报在样本外(原始样本结束后但发表前的时期)下降了约32%,发表后又额外下降了26%。
Hou、Xue和Zhang(2020)尝试对452个异象进行全面复制,发现在应用多重检验的适当修正后,包括许多知名因子在内的64%在常规显著性水平下未能复制。这些发现强调了专注于少数经过充分验证的因子而非追逐每个新发表异象的重要性。
共识因子
尽管存在因子动物园问题,少数因子经受住了跨市场、时间段和方法论数十年的审查。这些共识因子构成了现代因子投资的基础。
| 因子 | 描述 | 历史溢价 | 关键参考文献 |
|---|---|---|---|
| 价值 | 基本面相对低估的股票跑赢 | 年化约6%(1963–1990) | Fama and French (1992) |
| 动量 | 近期赢家在3–12个月内继续跑赢 | 月约1% | Jegadeesh and Titman (1993) |
| 质量 | 高盈利能力企业跑赢 | 年化约4% | Novy-Marx (2013) |
| 低波动率 | 低风险股票提供更高的风险调整后回报 | 高于CAPM预测的夏普比率 | Ang et al. (2006) |
| 规模 | 小盘股跑赢大盘股 | 发表后减弱 | Banz (1981) |
因子为什么获得溢价
某些因子为何获得持续溢价的问题对因子投资至关重要,因为答案决定了溢价是否可能在未来持续。三种广泛的解释被提出。
| 解释 | 机制 | 持续性启示 |
|---|---|---|
| 基于风险 | 因子溢价是承担系统性风险的补偿 | 应无限期持续 |
| 行为 | 投资者判断中的系统性错误 | 认知偏差稳定则持续 |
| 结构性 | 制度约束和市场摩擦 | 结构性特征不变则持续 |
因子交互与择时
因子不是孤立存在的。它们以影响组合构建和绩效的方式相互作用。
最重要的交互之一是价值和动量之间。这两个因子呈负相关(Asness、Moskowitz和Pedersen 2013),在组合中结合它们会产生显著的分散化收益。当价值表现不佳时,动量往往表现优异,反之亦然。
另一个重要的交互涉及质量和价值。不考虑质量而简单买入便宜股票的天真价值策略往往大量持有基本面恶化的困难公司。Novy-Marx(2013)表明控制质量可以显著改善价值策略的表现。
因子择时——根据预期未来回报动态调整因子暴露的做法——是因子投资中最具争议的话题之一。Arnott、Beck、Kalesnik和West(2016)认为因子本身也受价值和动量效应的影响。然而Asness(2016)警告说,因子择时增加了复杂性和换手率,但不能提供足够可靠的样本外绩效改善。
构建多因子组合
多因子组合的实际构建涉及几个可能显著影响绩效的关键决策。
| 决策 | 选项 | 权衡 |
|---|---|---|
| 组合方法论 | 组合混合 vs. 信号混合 | 信号混合避免自我对冲交易;组合混合更简单 |
| 因子权重 | 等权、风险平价、优化 | 等权/风险平价在样本外常与优化方法相当 |
| 再平衡频率 | 月度至年度 | 频率越高捕获溢价越多但成本越高 |
| 中性化 | 市场中性 vs. 纯多头;行业中性 | 市场中性分离因子但需要做空 |
实施现实
学术研究计算的理论因子回报与因子投资者实际获得的回报之间的差距可能相当大。理解这种实施不足的来源至关重要。
交易成本是最重要的不足来源。Frazzini、Israel和Moskowitz(2018)估计,对于美国股票中大型、执行良好的动量策略,交易成本消耗了机构规模组合总因子溢价的约40%至50%。
容量约束限制了投资者的交易在推动价格不利于自己之前可以在因子策略中部署的资本量。因子拥挤发生在太多投资者同时追求相同的因子策略时。Khandani和Lo(2011)记录的2007年8月量化危机是拥挤相关损失的戏剧性例子。
指数构建方法论比通常认识到的更重要。实施相同因子的两个指数提供商可能根据其在范围、信号定义、权重方案、再平衡频率和换手率约束方面的选择产生具有非常不同特征的组合。
税收效率是另一个实际考虑因素。高换手率的因子策略会产生短期资本收益,可能显著侵蚀应税投资者的税后回报。
最后,行为纪律可能是最重要的实施因素。无论多么成熟的因子都会经历长期的表现不佳。价值因子从大约2007年到2020年表现不佳超过十年。动量可能在数周内急剧崩盘。在回撤期间放弃因子策略的投资者会锁定损失并放弃最终的恢复。支持因子溢价的学术证据基于长期平均值;捕获这些溢价需要在不可避免的困难时期保持投资的耐心和纪律。
独立回测:多因子组合表现
为展示共识因子的组合在不同市场环境中的表现,下表呈现了四个Fama-French因子(HML、SMB、RMW和UMD)等权重、月度再平衡的十年期业绩。
方法论:使用Fama-French HML、SMB、RMW和UMD因子的月度收益率,等权重配置,月度再平衡,1963年1月至2025年12月。收益率为交易成本扣除前。
| 期间 | 年化收益率 | 夏普比率 | 最大回撤 |
|---|---|---|---|
| 1963–1969 | 7.2% | 0.61 | -12.4% |
| 1970–1979 | 8.5% | 0.58 | -18.7% |
| 1980–1989 | 6.8% | 0.52 | -14.2% |
| 1990–1999 | 5.9% | 0.45 | -16.8% |
| 2000–2009 | 7.6% | 0.49 | -28.3% |
| 2010–2019 | 2.1% | 0.18 | -22.5% |
| 2020–2025 | 5.4% | 0.42 | -15.1% |
| 全样本 1963–2025 | 6.1% | 0.47 | -28.3% |
2010年代是多因子策略最弱的十年,主要原因是价值因子的严重低迷(HML年化约-2%)和规模溢价的压缩。2020年代的部分恢复反映了2020年末开始的价值反弹以及动量和盈利因子的持续强势。
这些数据来源于公开的学术因子收益率数据,未考虑交易成本、市场冲击或实施约束。实际组合表现将有显著差异。
跨市场证据
因子投资的论据在国际市场中得到显著加强。仅在美国数据中持续的因子面临数据挖掘的合理质疑;在多个国家、法律制度和市场结构中出现的因子具有更高的可信度。
| 因子 | 美国 | 欧洲 | 日本 | 新兴市场 |
|---|---|---|---|---|
| 价值(HML) | 1963-2007强;2008-2020弱;恢复中 | 强且持续 | 非常强;全球最高溢价 | 强;更宽的估值差 |
| 动量(UMD) | 强(年化约7-8%) | 强 | 历史上弱;2010年后增强 | 存在但受流动性约束 |
| 质量(RMW/QMJ) | 强且防御性 | 强;尤其有效 | 强;有助避免价值陷阱 | 强;更宽的质量差 |
| 规模(SMB) | 无条件弱;质量筛选后强 | 温和但持续 | 温和 | 全球最强证据 |
| 低波动 | 强的风险调整收益 | 强 | 强 | 强 |
Fama和French(2012)在"Size, value, and momentum in international stock returns"中确认了价值和动量溢价存在于北美、欧洲、日本和亚太地区。Asness、Moskowitz和Pedersen(2013)在"Value and Momentum Everywhere"中扩展了这一证据,记录了不仅在全球股票市场,还在国债、货币和商品期货中的因子溢价。
日本市场尤具启发性。动量在日本历史上较弱,但2010年后的数据显示日本动量增强,这可能与公司治理改革(2014年尽责管理守则和2015年公司治理守则)导致外国机构投资者参与增加和信息流改善有关。
研究综述:证据现状
因子投资的累积研究成果指向金融经济学家间广泛(虽非完全)共识的几个结论。
第一,少数因子——价值、动量、质量/盈利性、低波动——通过了最严格的样本外检验、多重检验调整和跨市场复制。Harvey、Liu和Zhu(2016)表明400多个已发表因子中的大多数未能通过t统计量3.0的门槛,但共识因子一致达到这一标准。McLean和Pontiff(2016)记录了样本外平均32%、发表后26%的衰减,但衰减后共识因子的溢价仍具经济意义。
第二,因子溢价是理性风险补偿还是行为性错误定价的争论仍未解决,答案可能因因子而异。风险解释对价值(困境企业的真实风险)和规模(流动性不足和信息风险)最具说服力。行为解释对动量(反应不足和信息处理延迟)和低波动(彩票偏好和杠杆约束)更具说服力。
第三,实施现实大幅降低了论文收益。Frazzini、Israel和Moskowitz(2018)表明,交易成本、容量约束和拥挤效应可消耗总因子溢价的30-50%。
对于从业者,证据支持在低相关因子间分散、注重交易成本实施、并在不可避免的低迷期保持纪律的多因子方法。成本扣除后的年化多因子溢价应预期在2-4%范围内,并应为不利环境下超过20%的回撤做好准备。最有力的证据支持的信念不是某个因子在某一年将跑赢市场,而是分散化、耐心持有、成本意识的多因子组合将在足够长的时间内获得正溢价。