QD Research EngineAI-Synthesised

深度對沖:當神經網路取代布萊克-休斯

2026-03-09 · 15 min

神經網路可以直接從市場數據中學習最優對沖策略,考慮了經典布萊克-休斯理論忽略的交易成本和厚尾分布。

Deep LearningDerivativesHedgingReinforcement LearningOptionsTransaction Costs
來源: Buehler et al. (2019), Quantitative Finance

散戶投資者的實際應用

雖然散戶投資者很少需要對沖衍生品組合,但深度對沖的影響向下游傳導。造市商更好的對沖意味著更窄的選擇權價差和更有效的定價。在評估選擇權策略或結構化商品時,請理解其背後的定價和風險管理越來越由AI驅動。

編輯注釋

隨著AI改變金融的每個角落,深度對沖是神經網路明確改進經典理論的最清晰案例之一。隨著選擇權交易量創歷史新高、造市商越來越演算法化,從公式驅動到學習驅動的對沖策略轉變正在加速。

所有人都忽略的假設

問一個財務系的學生如何對沖選擇權,答案脫口而出:Delta 對沖。計算布萊克-休斯(Black-Scholes)的 Delta 值,買入或賣出相應數量的標的資產,持續調整,選擇權的風險便煙消雲散。這是金融理論中最優雅的成果之一——也是在實務中最常被違背的結論之一。

問題並非Delta 對沖在理論上有誤,而是理論所要求的條件在真實市場中從未存在過。布萊克-休斯模型假設可以無交易成本地連續交易、波動度恆定、報酬率服從對數常態分配。但現實市場中,每一筆交易都要支付買賣價差,波動度會聚集並出現跳躍,且報酬率呈現厚尾分配——這些都是模型系統性低估的。全球每一個選擇權交易桌都深知這一點。他們以各種臨機應變的方式來彌補——Gamma 交易、波動度曲面擬合、離散再平衡規則——但模型與現實之間的根本差距始終存在。

如果我們不從理想化的數學模型出發再修補其缺陷,而是直接從真實市場環境——包含所有摩擦成本、厚尾分配與交易成本——讓演算法自行學習最佳對沖策略呢?這正是深度對沖(deep hedging)的核心思想,也是機器學習在量化金融中最重要的應用之一。

深度對沖的本質

深度對沖由 Buehler、Gonon、Mancini 與 Wood 於 2019 年發表在《Quantitative Finance》期刊的論文「Deep Hedging」中首次提出(Buehler et al., 2019),以神經網路取代古典衍生性商品定價中的解析對沖公式,直接從數據中學習對沖策略。

其架構看似簡單。你持有一個衍生性商品部位——例如一個歐式買權——以及一組可用於對沖的交易工具(通常是標的資產,也可能包含其他流動性較高的衍生性商品)。在到期前的每個時間步,神經網路觀察當前的市場狀態——標的資產價格、距到期時間、目前的投組部位,以及隱含波動度等其他特徵——然後輸出對沖行動:每種工具應持有多少。

網路透過模擬進行訓練。你生成數千條反映真實市場動態的價格路徑——包括交易成本、離散交易間隔、跳躍、隨機波動度與流動性限制。對每條路徑,網路逐步執行其對沖策略。到期時,比較對沖後投組的損益與衍生性商品的損益,計算對沖誤差。接著優化網路參數,以最小化該對沖誤差的風險指標——不是均方誤差,而是反映對沖者實際風險偏好的指標,例如條件風險值(CVaR)或熵風險測度。

這正是其關鍵創新:深度對沖不假設標的資產遵循任何特定的動態模型。它不要求波動度恆定、報酬率服從常態分配或交易連續進行。它在實際面對的市場環境中——包括古典理論所忽略的所有摩擦——學習最佳對沖策略。

為何重要:交易成本問題

要理解深度對沖為何不僅僅是學術上的好奇心,請考慮交易成本問題。在布萊克-休斯框架下,最佳對沖需要連續再平衡——在每一瞬間調整 Delta 部位。而在實務中,每次再平衡交易都有成本:買賣價差、市場衝擊、手續費。

這產生了一個根本性的兩難。再平衡太頻繁,交易成本侵蝕利潤。再平衡太少,對沖誤差擴大。古典理論對此權衡提供的指引有限,因為這個權衡本身在無摩擦的布萊克-休斯世界中並不存在。

實務工作者發展出各種經驗法則:按固定時間間隔再平衡(每日、每小時)、當 Delta 偏離超過門檻時再平衡(帶寬對沖),或使用 Vega 對沖以降低對波動度變化的敏感性。這些方法效果尚可,但終究只是經驗法則,不保證是最優解。

深度對沖自然地解決了這個問題。因為交易成本已內建於訓練模擬中,神經網路自動學會在對沖精確度與交易成本之間取得平衡。它學會何時再平衡值得付出成本,何時容忍較大的對沖誤差反而較好。它能發現人類不會設計出的策略——例如,對盈虧不對稱處理的再平衡規則,或在選擇權接近價平時更積極對沖、深度價內或價外時放鬆對沖的策略。

超越布萊克-休斯:不完全市場

交易成本問題固然重要,但深度對沖最深遠的意義在於不完全市場。如果每種衍生性商品都能透過交易標的資產完美複製,該市場即為完全市場。在完全市場中,每種衍生性商品只有一個正確價格與一個正確的對沖策略。布萊克-休斯框架正是建立在這個世界之上。

真實市場是不完全的。你無法僅用標的股票完美對沖一個波動度交換合約。當長天期工具的流動性不佳時,你無法完美對沖長天期的異型選擇權。當個別成分的相關性彼此關聯但並不完美時,你無法完美對沖一個籃子選擇權。

在不完全市場中,不存在唯一的「正確」對沖策略。最佳策略取決於對沖者的風險偏好——願意容忍多少殘餘風險,以及最厭惡哪種風險。深度對沖透過風險指標的選擇自然地處理這一點。以 CVaR 訓練,你得到專注於降低尾部風險(極端情境中的大額虧損)的策略。以均值-變異數訓練,你得到最小化平均對沖誤差的策略。相同的神經網路架構,搭配不同的目標函數進行訓練,可產生截然不同的對沖策略,分別適合不同的風險偏好。

這種靈活性是古典對沖理論無法提供的。Delta 對沖給你一個答案。深度對沖給你一系列答案,每個答案都針對不同的風險偏好進行最佳化。

架構與訓練

深度對沖使用的神經網路通常是循環架構——長短期記憶(LSTM)網路,或在每個時間步應用的較簡單前饋網路。每一步的輸入包括當前標的資產價格(或其對數報酬率)、距到期時間、當前投組部位,以及可能從波動度曲面衍生的特徵。

訓練採用強化學習的技術:網路學習一個策略(對沖行動作為狀態的函數),以最佳化累積報酬(最小化最終對沖損益的風險指標)。然而,不同於一般的強化學習問題,深度對沖受益於已知的報酬結構——到期時衍生性商品的損益——這使得訓練比典型的強化學習應用更穩定且更具樣本效率。

一個關鍵的設計選擇是用於訓練的模擬模型。訓練路徑必須足夠真實,以捕捉網路在實務中將面對的市場動態。常見的選擇包括:

  • Heston 模型:具均值回歸變異數的隨機波動度模型
  • SABR 模型:隨機 Alpha-Beta-Rho 模型,廣泛用於利率衍生性商品
  • 跳躍擴散模型:捕捉突發的價格變動
  • GAN 生成路徑:使用以歷史數據訓練的生成對抗網路,產生逼真的合成路徑

模擬模型的選擇引入了一種微妙的模型依賴性。深度對沖在對沖策略並非由封閉解公式推導的意義上是「無模型」的,但訓練數據仍然由某個模型生成。如果訓練模型未能良好反映真實市場動態,學習到的策略可能表現不佳。這是一個活躍的研究領域,近期的研究聚焦於分配穩健的深度對沖——訓練在多種可能的市場動態下(而非單一假設模型下)都能表現良好的策略。

實際應用

選擇權交易桌

最直接的應用是銀行與造市商的選擇權交易桌。這些交易桌持有龐大而複雜的選擇權投組,涵蓋多種標的資產、不同的履約價與到期日。以台灣市場為例,在台灣證券交易所(TWSE)交易加權股價指數(TAIEX)選擇權的交易桌,便需管理跨多種合約的對沖策略。古典對沖需要計算並管理整本帳冊的希臘值(Delta、Gamma、Vega、Theta),通常對不同產品使用不同模型。深度對沖可以為整個投組學習統一的對沖策略,自然地考量跨資產相關性、交易成本與交易桌的特定風險限額。

異型衍生性商品

對於異型衍生性商品——障礙選擇權、亞式選擇權、自動贖回結構型商品——古典對沖公式要麼不存在,要麼需要嚴重的近似。深度對沖可以直接從模擬損益中學習這些商品的有效策略,無需封閉解。

風險管理

在對沖之外,此框架對風險衡量也有重要意義。深度對沖策略下的對沖損益分配,比大多數風險系統使用的標準希臘值近似,提供了更為真實的殘餘風險圖像。

限制與挑戰

深度對沖雖然強大,但在實務上仍面臨顯著的挑戰。

計算成本。 訓練深度對沖模型需要模擬數千條價格路徑,並在這些路徑上優化神經網路。對於複雜的投組,計算量可能相當龐大,不過 GPU 運算的進步已使其日益可行。

可解釋性。 神經網路的對沖決策是不透明的。當模型在某個特定情境下決定減少對沖時,原因並不顯而易見。這種缺乏可解釋性的問題可能讓風險管理者與監管機構感到不安,他們希望了解對沖策略為何如此建構。近期關於深度對沖可解釋人工智慧的研究試圖解決此問題,但仍是一個開放的挑戰。

模擬擬真度。 策略的優劣取決於訓練模擬的品質。如果模擬未能捕捉真實市場動態的重要特徵——流動性枯竭、相關性的結構性轉變、市場微結構效應——學習到的策略可能在最關鍵的時刻失效。

監管接受度。 金融監管機構對黑箱模型持謹慎態度。儘管深度對沖在回測與模擬中顯示出良好的結果,但在許多轄區,取得監管核准以投入實際使用仍是一道障礙。

更宏觀的視角

深度對沖代表了量化金融中一個更廣泛的趨勢:從模型驅動轉向數據驅動的方法。古典量化金融始於優雅的數學模型——布萊克-休斯、CAPMFama-French 模型——並從中解析推導最佳策略。深度對沖及相關的機器學習方法則從反方向出發:定義目標、提供真實數據,讓演算法自行找到策略。

這並不意味著古典模型已經過時。布萊克-休斯作為報價慣例、風險溝通語言和初步近似仍然不可或缺。但在面對真實摩擦的真實市場中進行實際對沖時,數據驅動方法的競爭力正日益增強。問題不在於神經網路是否會取代布萊克-休斯用於對沖,而在於整合的速度有多快,以及監管框架將如何調適。

對散戶投資者而言,直接的影響有限——很少有個人交易衍生性商品投組。但間接效果是顯著的。造市商更好的對沖意味著更窄的買賣價差和更有效率的選擇權市場。更精準的風險管理意味著更低的系統性風險。而這個智識框架——從現實出發而非從理想化假設出發——其應用遠不止衍生性商品,從最佳執行到投組建構皆然。

本文僅供教育目的,不構成金融建議。過去的績效不保證未來的結果。

本分析由 Buehler et al. (2019), Quantitative Finance QD Research Engine Quant Decoded 的自動化研究平台綜合分析,並經編輯團隊審核確保準確性。 了解我們的方法論.

參考文獻

僅供教育。