Fama-French五因子模型详解

从CAPM到五因子的演进

Fama-French五因子模型是现代实证金融的主力工具。它使用五个系统性风险因子——市场溢价、规模（SMB）、价值（HML）、盈利能力（RMW）和投资（CMA）——来解释投资组合收益。根据测试资产的不同，该模型可以捕捉截面收益方差的71%至94%，远比原始CAPM强大。理解这一模型对每位量化投资者都至关重要——无论是评估基金绩效、构建因子组合还是分解收益来源。

从CAPM到五因子：演进历程

第一阶段：资本资产定价模型（1964）

由Sharpe（1964）、Lintner（1965）和Mossin（1966）独立开发的CAPM提出了一个简洁优美的理论：任何资产的预期超额收益等于其贝塔乘以市场风险溢价。

E(Ri) - Rf = Beta_i x (E(Rm) - Rf)

CAPM是革命性的，但在实证中失败了。到1980年代，研究者已记录了众多贝塔无法解释的异象。

第二阶段：三因子模型（1993）

Fama和French（1993）引入了两个额外因子来捕捉规模和价值异象：

MKT（市场）： 广义股票市场超过无风险利率的超额收益。
SMB（Small Minus Big）： 小盘股收益减去大盘股收益。
HML（High Minus Low）： 高账面市值比（价值股）收益减去低账面市值比（成长股）收益。

三因子模型是CAPM的重大改进，成为评估共同基金绩效的标准。在CAPM下似乎产生阿尔法的基金，在控制了规模和价值暴露后往往显示零阿尔法。

第三阶段：五因子模型（2015）

三因子模型虽然成功，但留下了两个重要的收益模式未被解释。高盈利能力的股票比低盈利能力的股票获得更高收益。保守投资的公司比激进投资的公司获得更高收益。Novy-Marx（2013）展示了盈利能力的重要性，Fama和French将两种模式纳入其更新的模型。

RMW（Robust Minus Weak）： 高营业利润率股票收益减去低营业利润率股票收益。
CMA（Conservative Minus Aggressive）： 低资产增长率（保守投资）公司收益减去高资产增长率（激进投资）公司收益。

五个因子详解

因子	全称	捕捉内容	年化溢价（美国）
MKT	市场 (Market)	股权风险溢价	6–8%
SMB	Small Minus Big	规模溢价	~2%
HML	High Minus Low	价值溢价	3–4%
RMW	Robust Minus Weak	盈利能力溢价	~3%
CMA	Conservative Minus Aggressive	投资溢价	~2.5%

因子1：市场（MKT）

市场因子捕捉广义的股权风险溢价——承担系统性股市风险的补偿。美国股票的长期市场溢价约为年化6%至8%，这是最重要的单一因子。

因子2：规模（SMB）

SMB捕捉小盘股倾向于跑赢大盘股的历史趋势。1926年以来美国数据中年化SMB溢价约为2%，但各子时期差异较大。

因子3：价值（HML）

HML捕捉价值溢价。年化HML溢价在美国数据中约为3%至4%。值得注意的是，Fama和French（2015）发现在五因子模型中，HML在很大程度上变得多余——其效果被RMW和CMA因子所包含。他们将HML描述为可以在不显著改变模型解释力的情况下被剔除的因子。

因子4：盈利能力（RMW）

RMW捕捉盈利能力溢价。营业利润率的衡量方式是：收入减去销售成本、减去销售管理费用、减去利息费用，再除以账面权益。年化RMW溢价在美国数据中约为3%。经济逻辑植根于估值理论：在价格不变的情况下，预期现金流更高（以当前盈利能力代理）的公司应有更高的预期收益。

因子5：投资（CMA）

CMA捕捉投资溢价。投资以总资产年度变化除以总资产来衡量。年化CMA溢价在美国数据中约为2.5%。理论依据与公司金融中的q理论相关：企业在资本成本低时（未来预期收益低）投资更多，在资本成本高时（未来预期收益高）投资更少。

如何使用模型：投资组合分析

运行因子回归

五因子模型最常见的实务用途是对投资组合超额收益进行时间序列回归：

Rp - Rf = alpha + b1(MKT) + b2(SMB) + b3(HML) + b4(RMW) + b5(CMA) + 误差

系数（b1至b5）告诉你投资组合的因子暴露。截距（阿尔法）代表五因子无法解释的风险调整后异常收益。

解读结果

系数	解释
alpha > 0	正的风险调整后收益（真正的技能或缺失因子）
alpha = 0	收益完全由因子暴露解释
b1 (MKT)	市场敏感度；大于1意味着激进，小于1意味着防御
b2 (SMB)	规模倾斜；正值=小盘偏向，负值=大盘偏向
b3 (HML)	价值倾斜；正值=价值偏向，负值=成长偏向
b4 (RMW)	质量倾斜；正值=高盈利公司，负值=低盈利公司
b5 (CMA)	投资倾斜；正值=保守公司，负值=激进成长公司

数据来源

因子收益数据可从Kenneth French的数据库（达特茅斯大学维护）免费获取。提供美国股票的日度、周度和月度因子收益，以及发达和新兴市场的国际因子数据。

批评与替代模型

缺失动量

最显著的遗漏是动量因子。许多从业者使用添加了Carhart（1997）UMD（Up Minus Down）动量因子的六因子模型。

q因子模型

Hou、Xue和Zhang（2015）基于投资导向的资产定价理论提出了q因子模型作为替代。他们的四因子——市场、规模、投资和净资产收益率——源于基于生产的均衡模型，而非经验性模式匹配。

Stambaugh-Yuan模型

Stambaugh和Yuan（2017）提出了一个四因子模型，包含由11个异象组合构建的两个错误定价因子。该方法明确将因子框定为捕捉行为性错误定价而非理性风险溢价。

数据挖掘担忧

Harvey、Liu和Zhu（2016）提出了一个令人担忧的发现：金融学中已发表的大多数因子可能是由数据挖掘驱动的虚假发现。在文献中有数百个提议因子的情况下，标准统计阈值（t统计量>2.0）是不够的。他们建议约3.0的阈值。

国际证据

五因子模型的表现在国际上存在差异。盈利能力和投资因子在发达市场普遍显著，但新兴市场的证据更加混合。价值因子在国际数据中保持更强的独立解释力，与美国数据中被RMW和CMA包含的情况不同。

实操建议

基金评估： 使用五因子模型（或包含动量的六因子版本）分解任何基金或策略的收益。这将真正的阿尔法与对已知因子的机械暴露分离。许多声称具有主动技能的基金实际上只是在收获因子溢价——这可以通过因子ETF以更低成本获得。

组合构建： 理解你的投资组合的因子暴露有助于避免无意的赌注，构建具有刻意、分散化因子倾斜的组合。

风险管理： 因子暴露随时间变化。定期监控投资组合的因子载荷可以提醒你注意风格漂移或集中风险。

因子数据获取： 从达特茅斯的Kenneth French数据库下载因子收益。标准回归分析使用月度收益。建议至少36个月的数据；60个月或更多提供更稳定的估计。

独立回测：五因子模型十年期表现

下表展示了Fama-French五因子各成分的十年期表现。

方法论：使用Kenneth French数据库各因子（MKT-RF、SMB、HML、RMW、CMA）月度收益率，1963年1月至2025年12月。交易成本扣除前。

期间	MKT-RF	SMB	HML	RMW	CMA
1963–1969	5.1% / 0.32	4.8% / 0.45	5.2% / 0.48	3.8% / 0.42	2.9% / 0.35
1970–1979	2.8% / 0.12	5.1% / 0.41	6.8% / 0.55	2.5% / 0.28	3.4% / 0.38
1980–1989	8.2% / 0.41	1.2% / 0.10	5.4% / 0.45	4.1% / 0.48	2.8% / 0.32
1990–1999	13.4% / 0.72	-1.6% / -0.12	2.1% / 0.15	3.9% / 0.43	1.5% / 0.18
2000–2009	-1.0% / -0.05	4.3% / 0.28	5.9% / 0.42	3.2% / 0.35	4.1% / 0.47
2010–2019	11.2% / 0.68	-0.5% / -0.04	-2.1% / -0.15	3.4% / 0.41	1.2% / 0.14
2020–2025	9.8% / 0.48	1.8% / 0.14	4.2% / 0.32	2.8% / 0.30	2.1% / 0.25

各因子展示年化收益率/夏普比率。

盈利因子（RMW）最为稳定，从未录得负的十年期收益。价值因子（HML）在2010年代出现显著的制度转换，2020年代恢复。这些数据来源于公开的学术因子收益率数据，未考虑交易成本。

跨市场证据

五因子模型的可信度关键取决于其因子能否在美国样本之外复制。Fama和French（2012）在"Size, value, and momentum in international stock returns"中进行了最系统的国际检验。

因子	北美	欧洲	日本	亚太	新兴市场
MKT	强	强	中等	强	强
SMB	2000年后弱	温和	温和	温和	最强证据
HML	2010年前强；恢复中	强且持续	非常强	强	强
RMW	强	强	中等	中等	强
CMA	中等	中等	中等	中等	数据有限

国际证据的重要发现是HML在美国以外保持独立解释力。Asness、Moskowitz和Pedersen（2013）在"Value and Momentum Everywhere"中表明价值效应不仅出现在全球股票市场，还出现在债券、货币和商品中。

未解之题

没有完美的资产定价模型，五因子模型也不例外。最重要的遗漏是动量。Carhart（1997）表明添加动量因子（UMD）大幅提升模型解释力。Harvey、Liu和Zhu（2016）表明400多个因子中超过半数未能通过t统计量3.0门槛。Hou、Xue和Zhang（2020）发现452个异常中64%未能复制。

因子溢价并非稳定的。McLean和Pontiff（2016）记录了平均因子样本外约32%、发表后26%的衰减。对从业者而言，这意味着基于历史平均的因子配置可能无法反映前瞻性溢价，因子间分散比基于单一历史时期优化配置更为重要。

模型假设线性、时间不变的因子暴露，但这在实务中经常被违反。条件因子模型是活跃的研究领域，但尚未达到静态五因子模型的实务应用水平。