所有人都忽略的假設
問一個財務系的學生如何對沖選擇權,答案脫口而出:Delta 對沖。計算布萊克-休斯(Black-Scholes)的 Delta 值,買入或賣出相應數量的標的資產,持續調整,選擇權的風險便煙消雲散。這是金融理論中最優雅的成果之一——也是在實務中最常被違背的結論之一。
問題並非Delta 對沖在理論上有誤,而是理論所要求的條件在真實市場中從未存在過。布萊克-休斯模型假設可以無交易成本地連續交易、波動度恆定、報酬率服從對數常態分配。但現實市場中,每一筆交易都要支付買賣價差,波動度會聚集並出現跳躍,且報酬率呈現厚尾分配——這些都是模型系統性低估的。全球每一個選擇權交易桌都深知這一點。他們以各種臨機應變的方式來彌補——Gamma 交易、波動度曲面擬合、離散再平衡規則——但模型與現實之間的根本差距始終存在。
如果我們不從理想化的數學模型出發再修補其缺陷,而是直接從真實市場環境——包含所有摩擦成本、厚尾分配與交易成本——讓演算法自行學習最佳對沖策略呢?這正是深度對沖(deep hedging)的核心思想,也是機器學習在量化金融中最重要的應用之一。
深度對沖的本質
深度對沖由 Buehler、Gonon、Mancini 與 Wood 於 2019 年發表在《Quantitative Finance》期刊的論文「Deep Hedging」中首次提出(Buehler et al., 2019),以神經網路取代古典衍生性商品定價中的解析對沖公式,直接從數據中學習對沖策略。
其架構看似簡單。你持有一個衍生性商品部位——例如一個歐式買權——以及一組可用於對沖的交易工具(通常是標的資產,也可能包含其他流動性較高的衍生性商品)。在到期前的每個時間步,神經網路觀察當前的市場狀態——標的資產價格、距到期時間、目前的投組部位,以及隱含波動度等其他特徵——然後輸出對沖行動:每種工具應持有多少。
網路透過模擬進行訓練。你生成數千條反映真實市場動態的價格路徑——包括交易成本、離散交易間隔、跳躍、隨機波動度與流動性限制。對每條路徑,網路逐步執行其對沖策略。到期時,比較對沖後投組的損益與衍生性商品的損益,計算對沖誤差。接著優化網路參數,以最小化該對沖誤差的風險指標——不是均方誤差,而是反映對沖者實際風險偏好的指標,例如條件風險值(CVaR)或熵風險測度。
這正是其關鍵創新:深度對沖不假設標的資產遵循任何特定的動態模型。它不要求波動度恆定、報酬率服從常態分配或交易連續進行。它在實際面對的市場環境中——包括古典理論所忽略的所有摩擦——學習最佳對沖策略。
為何重要:交易成本問題
要理解深度對沖為何不僅僅是學術上的好奇心,請考慮交易成本問題。在布萊克-休斯框架下,最佳對沖需要連續再平衡——在每一瞬間調整 Delta 部位。而在實務中,每次再平衡交易都有成本:買賣價差、市場衝擊、手續費。
這產生了一個根本性的兩難。再平衡太頻繁,交易成本侵蝕利潤。再平衡太少,對沖誤差擴大。古典理論對此權衡提供的指引有限,因為這個權衡本身在無摩擦的布萊克-休斯世界中並不存在。
實務工作者發展出各種經驗法則:按固定時間間隔再平衡(每日、每小時)、當 Delta 偏離超過門檻時再平衡(帶寬對沖),或使用 Vega 對沖以降低對波動度變化的敏感性。這些方法效果尚可,但終究只是經驗法則,不保證是最優解。
深度對沖自然地解決了這個問題。因為交易成本已內建於訓練模擬中,神經網路自動學會在對沖精確度與交易成本之間取得平衡。它學會何時再平衡值得付出成本,何時容忍較大的對沖誤差反而較好。它能發現人類不會設計出的策略——例如,對盈虧不對稱處理的再平衡規則,或在選擇權接近價平時更積極對沖、深度價內或價外時放鬆對沖的策略。
超越布萊克-休斯:不完全市場
交易成本問題固然重要,但深度對沖最深遠的意義在於不完全市場。如果每種衍生性商品都能透過交易標的資產完美複製,該市場即為完全市場。在完全市場中,每種衍生性商品只有一個正確價格與一個正確的對沖策略。布萊克-休斯框架正是建立在這個世界之上。
真實市場是不完全的。你無法僅用標的股票完美對沖一個波動度交換合約。當長天期工具的流動性不佳時,你無法完美對沖長天期的異型選擇權。當個別成分的相關性彼此關聯但並不完美時,你無法完美對沖一個籃子選擇權。
在不完全市場中,不存在唯一的「正確」對沖策略。最佳策略取決於對沖者的風險偏好——願意容忍多少殘餘風險,以及最厭惡哪種風險。深度對沖透過風險指標的選擇自然地處理這一點。以 CVaR 訓練,你得到專注於降低尾部風險(極端情境中的大額虧損)的策略。以均值-變異數訓練,你得到最小化平均對沖誤差的策略。相同的神經網路架構,搭配不同的目標函數進行訓練,可產生截然不同的對沖策略,分別適合不同的風險偏好。
這種靈活性是古典對沖理論無法提供的。Delta 對沖給你一個答案。深度對沖給你一系列答案,每個答案都針對不同的風險偏好進行最佳化。
架構與訓練
深度對沖使用的神經網路通常是循環架構——長短期記憶(LSTM)網路,或在每個時間步應用的較簡單前饋網路。每一步的輸入包括當前標的資產價格(或其對數報酬率)、距到期時間、當前投組部位,以及可能從波動度曲面衍生的特徵。
訓練採用強化學習的技術:網路學習一個策略(對沖行動作為狀態的函數),以最佳化累積報酬(最小化最終對沖損益的風險指標)。然而,不同於一般的強化學習問題,深度對沖受益於已知的報酬結構——到期時衍生性商品的損益——這使得訓練比典型的強化學習應用更穩定且更具樣本效率。
一個關鍵的設計選擇是用於訓練的模擬模型。訓練路徑必須足夠真實,以捕捉網路在實務中將面對的市場動態。常見的選擇包括:
- Heston 模型:具均值回歸變異數的隨機波動度模型
- SABR 模型:隨機 Alpha-Beta-Rho 模型,廣泛用於利率衍生性商品
- 跳躍擴散模型:捕捉突發的價格變動
- GAN 生成路徑:使用以歷史數據訓練的生成對抗網路,產生逼真的合成路徑
模擬模型的選擇引入了一種微妙的模型依賴性。深度對沖在對沖策略並非由封閉解公式推導的意義上是「無模型」的,但訓練數據仍然由某個模型生成。如果訓練模型未能良好反映真實市場動態,學習到的策略可能表現不佳。這是一個活躍的研究領域,近期的研究聚焦於分配穩健的深度對沖——訓練在多種可能的市場動態下(而非單一假設模型下)都能表現良好的策略。
實際應用
選擇權交易桌
最直接的應用是銀行與造市商的選擇權交易桌。這些交易桌持有龐大而複雜的選擇權投組,涵蓋多種標的資產、不同的履約價與到期日。以台灣市場為例,在台灣證券交易所(TWSE)交易加權股價指數(TAIEX)選擇權的交易桌,便需管理跨多種合約的對沖策略。古典對沖需要計算並管理整本帳冊的希臘值(Delta、Gamma、Vega、Theta),通常對不同產品使用不同模型。深度對沖可以為整個投組學習統一的對沖策略,自然地考量跨資產相關性、交易成本與交易桌的特定風險限額。
異型衍生性商品
對於異型衍生性商品——障礙選擇權、亞式選擇權、自動贖回結構型商品——古典對沖公式要麼不存在,要麼需要嚴重的近似。深度對沖可以直接從模擬損益中學習這些商品的有效策略,無需封閉解。
風險管理
在對沖之外,此框架對風險衡量也有重要意義。深度對沖策略下的對沖損益分配,比大多數風險系統使用的標準希臘值近似,提供了更為真實的殘餘風險圖像。
限制與挑戰
深度對沖雖然強大,但在實務上仍面臨顯著的挑戰。
計算成本。 訓練深度對沖模型需要模擬數千條價格路徑,並在這些路徑上優化神經網路。對於複雜的投組,計算量可能相當龐大,不過 GPU 運算的進步已使其日益可行。
可解釋性。 神經網路的對沖決策是不透明的。當模型在某個特定情境下決定減少對沖時,原因並不顯而易見。這種缺乏可解釋性的問題可能讓風險管理者與監管機構感到不安,他們希望了解對沖策略為何如此建構。近期關於深度對沖可解釋人工智慧的研究試圖解決此問題,但仍是一個開放的挑戰。
模擬擬真度。 策略的優劣取決於訓練模擬的品質。如果模擬未能捕捉真實市場動態的重要特徵——流動性枯竭、相關性的結構性轉變、市場微結構效應——學習到的策略可能在最關鍵的時刻失效。
監管接受度。 金融監管機構對黑箱模型持謹慎態度。儘管深度對沖在回測與模擬中顯示出良好的結果,但在許多轄區,取得監管核准以投入實際使用仍是一道障礙。
更宏觀的視角
深度對沖代表了量化金融中一個更廣泛的趨勢:從模型驅動轉向數據驅動的方法。古典量化金融始於優雅的數學模型——布萊克-休斯、CAPM、Fama-French 模型——並從中解析推導最佳策略。深度對沖及相關的機器學習方法則從反方向出發:定義目標、提供真實數據,讓演算法自行找到策略。
這並不意味著古典模型已經過時。布萊克-休斯作為報價慣例、風險溝通語言和初步近似仍然不可或缺。但在面對真實摩擦的真實市場中進行實際對沖時,數據驅動方法的競爭力正日益增強。問題不在於神經網路是否會取代布萊克-休斯用於對沖,而在於整合的速度有多快,以及監管框架將如何調適。
對散戶投資者而言,直接的影響有限——很少有個人交易衍生性商品投組。但間接效果是顯著的。造市商更好的對沖意味著更窄的買賣價差和更有效率的選擇權市場。更精準的風險管理意味著更低的系統性風險。而這個智識框架——從現實出發而非從理想化假設出發——其應用遠不止衍生性商品,從最佳執行到投組建構皆然。
本文僅供教育目的,不構成金融建議。過去的績效不保證未來的結果。
本分析由 Buehler et al. (2019), Quantitative Finance 經 QD Research Engine — Quant Decoded 的自動化研究平台 — 綜合分析,並經編輯團隊審核確保準確性。 了解我們的方法論.
參考文獻
-
Buehler, H., Gonon, L., Teichmann, J., & Wood, B. (2019). Deep Hedging. Quantitative Finance, 19(8), 1271-1291. https://doi.org/10.1080/14697688.2019.1571683
-
Black, F., & Scholes, M. (1973). The Pricing of Options and Corporate Liabilities. Journal of Political Economy, 81(3), 637-654. https://doi.org/10.1086/260062
-
Cao, J., Chen, J., Hull, J., & Poulos, Z. (2021). Deep Hedging of Derivatives Using Reinforcement Learning. Journal of Financial Data Science, 3(1), 10-27. https://doi.org/10.3905/jfds.2020.1.052
-
Horvath, B., Teichmann, J., & Zuric, Z. (2021). Deep Hedging under Rough Volatility. Quantitative Finance, 21(2), 235-247. https://doi.org/10.1080/14697688.2020.1817974