深度對沖：當神經網路取代布萊克-休斯

所有人都忽略的假設

問一個財務系的學生如何對沖選擇權，答案脫口而出：Delta 對沖。計算布萊克-休斯（Black-Scholes）的 Delta 值，買入或賣出相應數量的標的資產，持續調整，選擇權的風險便煙消雲散。這是金融理論中最優雅的成果之一——也是在實務中最常被違背的結論之一。

問題並非Delta 對沖在理論上有誤，而是理論所要求的條件在真實市場中從未存在過。布萊克-休斯模型假設可以無交易成本地連續交易、波動度恆定、報酬率服從對數常態分配。但現實市場中，每一筆交易都要支付買賣價差，波動度會聚集並出現跳躍，且報酬率呈現厚尾分配——這些都是模型系統性低估的。全球每一個選擇權交易桌都深知這一點。他們以各種臨機應變的方式來彌補——Gamma 交易、波動度曲面擬合、離散再平衡規則——但模型與現實之間的根本差距始終存在。

如果我們不從理想化的數學模型出發再修補其缺陷，而是直接從真實市場環境——包含所有摩擦成本、厚尾分配與交易成本——讓演算法自行學習最佳對沖策略呢？這正是深度對沖（deep hedging）的核心思想，也是機器學習在量化金融中最重要的應用之一。

深度對沖的本質

深度對沖由 Buehler、Gonon、Mancini 與 Wood 於 2019 年發表在《Quantitative Finance》期刊的論文「Deep Hedging」中首次提出（Buehler et al., 2019），以神經網路取代古典衍生性商品定價中的解析對沖公式，直接從數據中學習對沖策略。

其架構看似簡單。你持有一個衍生性商品部位——例如一個歐式買權——以及一組可用於對沖的交易工具（通常是標的資產，也可能包含其他流動性較高的衍生性商品）。在到期前的每個時間步，神經網路觀察當前的市場狀態——標的資產價格、距到期時間、目前的投組部位，以及隱含波動度等其他特徵——然後輸出對沖行動：每種工具應持有多少。

網路透過模擬進行訓練。你生成數千條反映真實市場動態的價格路徑——包括交易成本、離散交易間隔、跳躍、隨機波動度與流動性限制。對每條路徑，網路逐步執行其對沖策略。到期時，比較對沖後投組的損益與衍生性商品的損益，計算對沖誤差。接著優化網路參數，以最小化該對沖誤差的風險指標——不是均方誤差，而是反映對沖者實際風險偏好的指標，例如條件風險值（CVaR）或熵風險測度。

這正是其關鍵創新：深度對沖不假設標的資產遵循任何特定的動態模型。它不要求波動度恆定、報酬率服從常態分配或交易連續進行。它在實際面對的市場環境中——包括古典理論所忽略的所有摩擦——學習最佳對沖策略。

為何重要：交易成本問題

要理解深度對沖為何不僅僅是學術上的好奇心，請考慮交易成本問題。在布萊克-休斯框架下，最佳對沖需要連續再平衡——在每一瞬間調整 Delta 部位。而在實務中，每次再平衡交易都有成本：買賣價差、市場衝擊、手續費。

這產生了一個根本性的兩難。再平衡太頻繁，交易成本侵蝕利潤。再平衡太少，對沖誤差擴大。古典理論對此權衡提供的指引有限，因為這個權衡本身在無摩擦的布萊克-休斯世界中並不存在。

實務工作者發展出各種經驗法則：按固定時間間隔再平衡（每日、每小時）、當 Delta 偏離超過門檻時再平衡（帶寬對沖），或使用 Vega 對沖以降低對波動度變化的敏感性。這些方法效果尚可，但終究只是經驗法則，不保證是最優解。

深度對沖自然地解決了這個問題。因為交易成本已內建於訓練模擬中，神經網路自動學會在對沖精確度與交易成本之間取得平衡。它學會何時再平衡值得付出成本，何時容忍較大的對沖誤差反而較好。它能發現人類不會設計出的策略——例如，對盈虧不對稱處理的再平衡規則，或在選擇權接近價平時更積極對沖、深度價內或價外時放鬆對沖的策略。

超越布萊克-休斯：不完全市場

交易成本問題固然重要，但深度對沖最深遠的意義在於不完全市場。如果每種衍生性商品都能透過交易標的資產完美複製，該市場即為完全市場。在完全市場中，每種衍生性商品只有一個正確價格與一個正確的對沖策略。布萊克-休斯框架正是建立在這個世界之上。

真實市場是不完全的。你無法僅用標的股票完美對沖一個波動度交換合約。當長天期工具的流動性不佳時，你無法完美對沖長天期的異型選擇權。當個別成分的相關性彼此關聯但並不完美時，你無法完美對沖一個籃子選擇權。

在不完全市場中，不存在唯一的「正確」對沖策略。最佳策略取決於對沖者的風險偏好——願意容忍多少殘餘風險，以及最厭惡哪種風險。深度對沖透過風險指標的選擇自然地處理這一點。以 CVaR 訓練，你得到專注於降低尾部風險（極端情境中的大額虧損）的策略。以均值-變異數訓練，你得到最小化平均對沖誤差的策略。相同的神經網路架構，搭配不同的目標函數進行訓練，可產生截然不同的對沖策略，分別適合不同的風險偏好。

這種靈活性是古典對沖理論無法提供的。Delta 對沖給你一個答案。深度對沖給你一系列答案，每個答案都針對不同的風險偏好進行最佳化。

架構與訓練

深度對沖使用的神經網路通常是循環架構——長短期記憶（LSTM）網路，或在每個時間步應用的較簡單前饋網路。每一步的輸入包括當前標的資產價格（或其對數報酬率）、距到期時間、當前投組部位，以及可能從波動度曲面衍生的特徵。

訓練採用強化學習的技術：網路學習一個策略（對沖行動作為狀態的函數），以最佳化累積報酬（最小化最終對沖損益的風險指標）。然而，不同於一般的強化學習問題，深度對沖受益於已知的報酬結構——到期時衍生性商品的損益——這使得訓練比典型的強化學習應用更穩定且更具樣本效率。

一個關鍵的設計選擇是用於訓練的模擬模型。訓練路徑必須足夠真實，以捕捉網路在實務中將面對的市場動態。常見的選擇包括：

Heston 模型：具均值回歸變異數的隨機波動度模型
SABR 模型：隨機 Alpha-Beta-Rho 模型，廣泛用於利率衍生性商品
跳躍擴散模型：捕捉突發的價格變動
GAN 生成路徑：使用以歷史數據訓練的生成對抗網路，產生逼真的合成路徑

模擬模型的選擇引入了一種微妙的模型依賴性。深度對沖在對沖策略並非由封閉解公式推導的意義上是「無模型」的，但訓練數據仍然由某個模型生成。如果訓練模型未能良好反映真實市場動態，學習到的策略可能表現不佳。這是一個活躍的研究領域，近期的研究聚焦於分配穩健的深度對沖——訓練在多種可能的市場動態下（而非單一假設模型下）都能表現良好的策略。

實際應用

選擇權交易桌

最直接的應用是銀行與造市商的選擇權交易桌。這些交易桌持有龐大而複雜的選擇權投組，涵蓋多種標的資產、不同的履約價與到期日。以台灣市場為例，在台灣證券交易所（TWSE）交易加權股價指數（TAIEX）選擇權的交易桌，便需管理跨多種合約的對沖策略。古典對沖需要計算並管理整本帳冊的希臘值（Delta、Gamma、Vega、Theta），通常對不同產品使用不同模型。深度對沖可以為整個投組學習統一的對沖策略，自然地考量跨資產相關性、交易成本與交易桌的特定風險限額。

異型衍生性商品

對於異型衍生性商品——障礙選擇權、亞式選擇權、自動贖回結構型商品——古典對沖公式要麼不存在，要麼需要嚴重的近似。深度對沖可以直接從模擬損益中學習這些商品的有效策略，無需封閉解。

風險管理

在對沖之外，此框架對風險衡量也有重要意義。深度對沖策略下的對沖損益分配，比大多數風險系統使用的標準希臘值近似，提供了更為真實的殘餘風險圖像。

限制與挑戰

深度對沖雖然強大，但在實務上仍面臨顯著的挑戰。

計算成本。 訓練深度對沖模型需要模擬數千條價格路徑，並在這些路徑上優化神經網路。對於複雜的投組，計算量可能相當龐大，不過 GPU 運算的進步已使其日益可行。

可解釋性。 神經網路的對沖決策是不透明的。當模型在某個特定情境下決定減少對沖時，原因並不顯而易見。這種缺乏可解釋性的問題可能讓風險管理者與監管機構感到不安，他們希望了解對沖策略為何如此建構。近期關於深度對沖可解釋人工智慧的研究試圖解決此問題，但仍是一個開放的挑戰。

模擬擬真度。 策略的優劣取決於訓練模擬的品質。如果模擬未能捕捉真實市場動態的重要特徵——流動性枯竭、相關性的結構性轉變、市場微結構效應——學習到的策略可能在最關鍵的時刻失效。

監管接受度。 金融監管機構對黑箱模型持謹慎態度。儘管深度對沖在回測與模擬中顯示出良好的結果，但在許多轄區，取得監管核准以投入實際使用仍是一道障礙。

更宏觀的視角

深度對沖代表了量化金融中一個更廣泛的趨勢：從模型驅動轉向數據驅動的方法。古典量化金融始於優雅的數學模型——布萊克-休斯、CAPM、Fama-French 模型——並從中解析推導最佳策略。深度對沖及相關的機器學習方法則從反方向出發：定義目標、提供真實數據，讓演算法自行找到策略。

這並不意味著古典模型已經過時。布萊克-休斯作為報價慣例、風險溝通語言和初步近似仍然不可或缺。但在面對真實摩擦的真實市場中進行實際對沖時，數據驅動方法的競爭力正日益增強。問題不在於神經網路是否會取代布萊克-休斯用於對沖，而在於整合的速度有多快，以及監管框架將如何調適。

對散戶投資者而言，直接的影響有限——很少有個人交易衍生性商品投組。但間接效果是顯著的。造市商更好的對沖意味著更窄的買賣價差和更有效率的選擇權市場。更精準的風險管理意味著更低的系統性風險。而這個智識框架——從現實出發而非從理想化假設出發——其應用遠不止衍生性商品，從最佳執行到投組建構皆然。

本文僅供教育目的，不構成金融建議。過去的績效不保證未來的結果。

參考文獻

Buehler, H., Gonon, L., Teichmann, J., & Wood, B. (2019). Deep Hedging. Quantitative Finance, 19(8), 1271-1291. https://doi.org/10.1080/14697688.2019.1571683
Black, F., & Scholes, M. (1973). The Pricing of Options and Corporate Liabilities. Journal of Political Economy, 81(3), 637-654. https://doi.org/10.1086/260062
Cao, J., Chen, J., Hull, J., & Poulos, Z. (2021). Deep Hedging of Derivatives Using Reinforcement Learning. Journal of Financial Data Science, 3(1), 10-27. https://doi.org/10.3905/jfds.2020.1.052
Horvath, B., Teichmann, J., & Zuric, Z. (2021). Deep Hedging under Rough Volatility. Quantitative Finance, 21(2), 235-247. https://doi.org/10.1080/14697688.2020.1817974