量化投资中的行为偏差：系统性克服认知偏误

核心要点

过度自信、锚定效应、羊群效应和损失厌恶等认知偏差会造成持续性的定价错误，量化策略可以系统性地加以利用。然而，量化投资者并非免疫——模型过拟合本身就是一种伪装成严谨分析的认知偏差。最有效的方法是将对人类非理性的认知与从投资流程中消除主观判断的规则化系统流程相结合。

行为偏差为何对量化投资者至关重要

传统金融学假设投资者是能够高效处理信息并准确为证券定价的理性主体。卡尼曼（Kahneman）、特沃斯基（Tversky）和塞勒（Thaler）等学者通过NBER工作论文系列等平台综合的数十年研究已经打破了这一假设。投资者以可预测的方式系统性地偏离理性行为。

对量化投资者而言，这既是机遇也是警告。机遇在于设计利用可预测错误的策略。警告则是量化投资者自身仍然是人类，他们的偏差会以微妙但有害的方式渗透到研究过程中。

行为金融学并未完全否定有效市场。相反，它解释了为何动量、价值、低波动率等特定异象在被广泛记录后仍然持续。这些异象之所以存续，是因为产生它们的偏差深深嵌入人类认知中，难以通过套利完全消除。

核心偏差分类

理解主要认知偏差对于利用市场非效率和防范个人盲点都至关重要。

**过度自信（Overconfidence）**可能是最普遍的偏差。巴伯（Barber）和奥迪恩（Odean，2001）的研究表明，过度自信的投资者交易频率比理性基准高45%，导致年化净收益降低约2.6个百分点。过度自信表现为预测精度的夸大、对随机结果的控制幻觉，以及认为自己的信息优势比实际更大的信念。

**锚定效应（Anchoring）**发生在投资者执着于无关的参考点——股票的52周最高价、之前的买入价格或整数价位——并且未能从中做出充分调整时。锚定效应有助于解释为何整数价格水平附近会出现独特的交易模式，以及为何分析师预测倾向于围绕先前的共识估计聚集，而非独立反映新信息。

**羊群效应（Herding）**驱使投资者追随大众而非自己的分析。这造成了超越基本面合理范围的价格趋势，最终反转。羊群效应因职业风险而被放大：偏离共识且表现不佳的专业基金经理面临被解雇的风险，而与同行一起亏损的经理受到的审查要少得多。

**近期偏差（Recency bias）**导致投资者过度重视近期事件，并将短期趋势外推至未来。市场崩盘后，投资者变得过度悲观；反弹后则过度乐观。这种偏差在中期贡献于动量效应，在更长期则贡献于均值回归。

损失厌恶（Loss aversion）——感受损失的强度约为同等收益的两倍——支撑着处置效应、前景理论以及风险溢价之谜的大部分内容。它导致投资者持有亏损头寸过久（希望回本），而过早卖出盈利头寸（锁定收益）。

偏差如何创造可利用的异象

行为偏差与知名因子溢价之间的联系在学术文献中已经得到充分确立。

偏差	创造/强化的要素	机制
对新闻反应不足	动量	缓慢的信息处理创造趋势性价格
对叙事过度反应	价值	明星股被高估；被忽视的股票变得便宜
彩票偏好	低波动率异象	对高贝塔"彩票"股票的需求推高其价格
处置效应	动量与价值	赢家卖得太早（动量）；输家持有太久（价值）
羊群效应	动量	趋势追随的群体延长价格运动
锚定效应	盈余公告后漂移	固化的估计延缓了对意外信息的完全价格调整

动量因子受益于投资者对新信息的初始反应不足。丹尼尔（Daniel）、赫舒莱弗（Hirshleifer）和苏布拉马尼亚姆（Subrahmanyam，1998）提出过度自信和有偏的自我归因创造了趋势性行为。价值因子则从相反的模式中受益——对叙事的过度反应。

低波动率异象部分源于巴贝里斯（Barberis）和黄（Huang，2008）记录的"彩票偏好"偏差。投资者因高波动率股票类似于小概率大回报的彩票而为之支付过高价格。这种需求膨胀抑制了高风险股票的后续收益，提升了无聊、稳定股票的收益。

量化投资者自身的偏差

这是一个令人不安的事实：量化投资者也有自己的一套偏差，而这些偏差因隐藏在数学精密性背后而往往更加危险。

模型过拟合是一种认知偏差。 当研究者测试数百种规格并选择具有最高回测夏普比率的那个时，这个过程感觉很严谨。但它实际上是由确认偏差驱动的——研究者在无意识中寻找支持预设观念的证据。贝利（Bailey）和洛佩斯·德·普拉多（Lopez de Prado，2014）表明，在没有对多重检验进行适当调整的情况下，大多数已发表的回测策略很可能是虚假发现。

**数据窥探（Data snooping）**是伪装的锚定效应。一旦研究者看过数据，就几乎不可能提出真正独立的假设。思维锚定于观察到的模式，并逆向工程出合理的解释。这就是样本外检验和假设预注册如此重要的原因。

**复杂性偏差（Complexity bias）**导致量化研究者偏好复杂模型，即使简单模型在样本外表现同样好或更好。一个50因子的机器学习模型感觉比3因子的线性模型更令人印象深刻，但增加的复杂性往往捕获的是噪声而非信号。

**叙事谬误（Narrative fallacy）**在量化投资者构建令人信服的故事来解释回测结果时发挥作用。故事创造了对策略前瞻有效性的虚假信心。策略应基于理论先验和样本外证据来评估，而非基于叙事的满意度。

通过系统化流程消除偏差

对抗行为偏差最有效的防御是从尽可能多的投资决策中消除人类的自由裁量权。这是量化投资的核心论据。但消除偏差必须延伸到研究过程本身。

**预承诺协议（Pre-commitment protocols）**要求研究者在查看结果之前明确假设、数据、方法论和成功标准。这反映了临床研究中的预注册运动，能大幅减少数据窥探。

**多重检验调整（Multiple testing adjustments）**如邦费罗尼（Bonferroni）校正或压缩夏普比率，考虑了被测试策略的数量。如果研究者测试了100种规格，t统计量2.0不再显著——阈值上升到约3.4。

**集成方法（Ensemble approaches）**将多个弱信号组合起来，而非依赖单一优化模型，对过拟合更加稳健。它们还减少了任何单个研究者的偏差对最终投资组合的影响。

**系统化再平衡规则（Systematic rebalancing rules）**消除了在压力时期覆盖信号的诱惑。最具破坏性的投资者行为恰恰发生在偏差最强的市场极端时期。预先确定的机械化再平衡流程消除了这一脆弱性。

**团队审查（Team-based review）**引入了问责制和认知多样性。拥有经过训练扮演"魔鬼代言人"角色的多元化研究团队能够捕获个人遗漏的偏差。

投资组合构建的实际启示

理解行为偏差对投资组合的构建和管理方式有着直接启示。

首先，收获行为溢价的因子策略——动量、价值、低波动率——应当成为核心持仓。这些异象之所以存在，是因为它们根植于持久的人类心理，而非暂时的市场错位。

其次，不同偏差在不同时期占主导地位，因此跨因子分散化至关重要。动量受益于反应不足，价值受益于过度反应。两者往往呈负相关，提供天然的对冲。

第三，对于没有行为或风险解释理论基础却展现出色回测表现的策略，投资者应保持深度怀疑。如果一个策略无法回答"我在利用谁的行为错误？"这个问题，那么它更可能是过拟合的产物，而非真正的阿尔法来源。

第四，执行纪律与信号质量同等重要。以过度自信的仓位管理或恐慌驱动的退出来执行的优秀策略，将不如以机械化一致性执行的平庸策略。

局限性

行为偏差是真实存在且记录充分的，但并不保证未来的可利用性。随着越来越多的资金瞄准行为异象，溢价可能会缩小。偏差导致的定价错误在时间上本质上是不可预测的，基于此的策略可能经历长期回撤。此外，区分真正的行为效应和统计伪象仍然具有挑战性，尤其是在历史数据有限的市场中。投资者应将行为金融学视为理解市场的透镜，而非保证的阿尔法来源。

参考文献

Daniel, K., Hirshleifer, D., & Subrahmanyam, A. (1998). "Investor Psychology and Security Market Under- and Overreactions." The Journal of Finance, 53(6), 1839-1885. https://doi.org/10.1111/0022-1082.00077
Barber, B. M., & Odean, T. (2001). "Boys Will Be Boys: Gender, Overconfidence, and Common Stock Investment." The Quarterly Journal of Economics, 116(1), 261-292. https://doi.org/10.1162/003355301556400