ディープヘッジング：ニューラルネットワークがブラック・ショールズに代わるとき

誰もが無視する仮定

金融を学ぶ学生にオプションのヘッジング方法を尋ねれば、答えは即座に返ってきます：デルタ・ヘッジングです。ブラック・ショールズのデルタを計算し、その分だけ原資産を売買し、連続的に調整すれば、オプションのリスクは消滅します。これは金融理論における最も優美な結果の一つであり、同時に実務で最も頻繁に破られる結果の一つでもあります。

問題は、デルタ・ヘッジングが理論的に間違っているということではありません。理論が要求する条件を、実際の市場が決して満たさないということです。ブラック・ショールズ・モデルは、取引コストのない連続取引、一定のボラティリティ、対数正規分布に従うリターンを前提とします。しかし実際の市場では、すべての取引にビッド・アスク・スプレッドがかかり、ボラティリティはクラスタリングやジャンプを示し、モデルが体系的に過小評価するファットテールのリターンを生み出します。世界中のオプション・デスクがこの事実を知っています。ガンマ・スキャルピング、ボラティリティ・サーフェスのフィッティング、離散的なリバランス・ルールといったアドホックな調整で補っていますが、モデルと現実の根本的な乖離は残ったままです。

もし、理想化された数学的モデルから出発してその欠陥を修繕するのではなく、実際の市場環境——あらゆる摩擦、ファットテール、取引コストを含む——から出発して、アルゴリズムに最適なヘッジング戦略を直接学習させたらどうなるでしょうか。これがディープ・ヘッジングの前提であり、機械学習のクオンツ・ファイナンスへの応用として最も意義深いもののひとつです。

ディープ・ヘッジングとは何か

ディープ・ヘッジングは、BuehlerとGonon、Mancini、Woodが2019年にQuantitative Financeに発表した論文「Deep Hedging」(Buehler et al., 2019)で初めて提案されました。古典的なデリバティブ・プライシングの解析的ヘッジング公式を、データから直接ヘッジングを学習するニューラルネットワークに置き換えるものです。

その仕組みは意外にシンプルです。デリバティブのポジション——例えばヨーロピアン・コール・オプション——があり、それをヘッジするために取引できる商品群（通常は原資産、場合によっては流動性の高い他のデリバティブ）があります。満期前の各タイムステップにおいて、ニューラルネットワークは現在の市場状態——原資産価格、残存期間、現在のポートフォリオ保有量、そしてインプライド・ボラティリティなどの追加フィーチャー——を観察し、ヘッジング・アクションを出力します：各商品をどれだけ保有するかを決定します。

ネットワークはシミュレーションによって訓練されます。取引コスト、離散的な取引間隔、ジャンプ、確率的ボラティリティ、流動性制約などの現実的な市場ダイナミクスを反映した数千の価格パスを生成します。各パスにおいて、ネットワークはステップごとにヘッジング戦略を実行します。満期時点で、ヘッジされたポートフォリオのペイオフとデリバティブのペイオフを比較してヘッジング・エラーを計算します。ネットワークのパラメータは、このヘッジング・エラーのリスク尺度——単なる平均二乗誤差ではなく、条件付きバリュー・アット・リスク（CVaR）やエントロピック・リスク尺度のように、ヘッジャーの実際のリスク選好を反映する尺度——を最小化するように最適化されます。

これが核心的なイノベーションです：ディープ・ヘッジングは原資産のダイナミクスについて特定のモデルを仮定しません。ボラティリティが一定である必要も、リターンが正規分布に従う必要も、取引が連続的である必要もありません。古典的理論が仮定で排除してしまうすべての摩擦を含めた、実際に直面する市場環境において最適なヘッジング戦略を学習するのです。

なぜ重要なのか：取引コスト問題

ディープ・ヘッジングが単なる学術的な興味以上のものである理由を理解するには、取引コスト問題を考える必要があります。ブラック・ショールズの下での最適ヘッジは連続的なリバランス——毎瞬間デルタ・ポジションを調整すること——を要求します。実務では、すべてのリバランス取引にコストが発生します：ビッド・アスク・スプレッド、マーケット・インパクト、ブローカレッジ手数料などです。

これは根本的なジレンマを生み出します。リバランスの頻度が高すぎれば取引コストが利益を食い潰し、低すぎればヘッジング・エラーが拡大します。古典的理論はこのトレードオフについて限定的な指針しか提供しません。なぜなら、摩擦のないブラック・ショールズの世界ではこのトレードオフ自体が存在しないからです。

実務家たちはさまざまなヒューリスティクスを開発してきました：固定時間間隔（日次、時間ごと）でリバランスする方法、デルタが閾値を超えた時にリバランスする方法（バンドウィズ・ヘッジング）、あるいはベガ・ヘッジングでボラティリティ変動への感応度を低減する方法などです。これらのヒューリスティクスはそれなりに機能しますが、まさにヒューリスティクスにすぎません。最適である保証はないのです。

ディープ・ヘッジングはこの問題を自然に解決します。取引コストが訓練シミュレーションに組み込まれているため、ニューラルネットワークはヘッジング精度と取引コストのバランスを自動的に学習します。リバランスがコストに見合う場面と、より大きなヘッジング・エラーを許容した方が良い場面を自ら判断します。例えば、利益と損失を非対称に扱うリバランス・ルールや、オプションがアット・ザ・マネー付近ではより積極的にヘッジし、ディープ・イン・ザ・マネーやディープ・アウト・オブ・ザ・マネーでは控えめにヘッジする戦略など、人間が設計しないような戦略を発見できます。

ブラック・ショールズを超えて：不完全市場

取引コスト問題も重要ですが、ディープ・ヘッジングの最も深い含意は不完全市場に関するものです。すべてのデリバティブを原資産の取引で完全に複製できる市場を完全市場と呼びます。完全市場では、すべてのデリバティブに唯一の正しい価格と唯一の正しいヘッジが存在します。ブラック・ショールズの枠組みはこの世界に存在しています。

実際の市場は不完全です。原株式だけでボラティリティ・スワップを完全にヘッジすることはできません。長期商品の流動性が低い場合に長期エキゾチック・オプションを完全にヘッジすることはできません。個々の構成要素の相関が不完全な場合にバスケット・オプションを完全にヘッジすることはできません。日経225オプション市場においても、こうした不完全性は同様に存在します。

不完全市場では、唯一の「正しい」ヘッジは存在しません。最適戦略はヘッジャーのリスク選好——残余リスクをどれだけ許容できるか、どのようなリスクを最も忌避するか——に依存します。ディープ・ヘッジングはリスク尺度の選択を通じてこれを自然に処理します。CVaRで訓練すれば、テール・リスク——極端なシナリオにおける大きな損失——の低減に重点を置いた戦略が得られます。平均分散で訓練すれば、平均ヘッジング・エラーを最小化する戦略が得られます。同一のニューラルネットワーク・アーキテクチャを異なる目的関数で訓練することで、異なるリスク選好に合わせた質的に異なるヘッジング戦略が生成されます。

この柔軟性は、古典的ヘッジング理論では決して提供できないものです。デルタ・ヘッジングはひとつの答えしか与えません。ディープ・ヘッジングは、それぞれ異なるリスク選好に対して最適な答えのファミリーを提供します。

アーキテクチャと訓練

ディープ・ヘッジングに使用されるニューラルネットワークは、一般的にリカレント・アーキテクチャ——LSTM（Long Short-Term Memory）ネットワーク、あるいは各タイムステップに適用されるシンプルなフィードフォワード・ネットワーク——です。各ステップの入力には、現在の原資産価格（またはその対数リターン）、残存期間、現在のポートフォリオ保有量、そしてボラティリティ・サーフェスから導出されたフィーチャーなどが含まれます。

訓練には強化学習の手法が用いられます：ネットワークは累積報酬（最終的なヘッジングP&Lのリスク尺度の最小化）を最適化するポリシー（状態の関数としてのヘッジング・アクション）を学習します。ただし、一般的な強化学習の問題とは異なり、ディープ・ヘッジングは既知の報酬構造——満期時のデリバティブのペイオフ——を活用できるため、一般的なRL応用より訓練が安定的かつサンプル効率的です。

重要な設計上の選択は、訓練に使用するシミュレーション・モデルです。訓練パスは、ネットワークが実務で直面する市場ダイナミクスを十分に捉えるほど現実的でなければなりません。一般的に使用されるモデルは以下の通りです：

ヘストン・モデル：平均回帰する分散を持つ確率的ボラティリティ・モデル
SABRモデル：金利デリバティブで広く使われる確率的アルファ・ベータ・ロー・モデル
ジャンプ拡散モデル：急激な価格変動を捉えるモデル
GANで生成したパス：過去のデータで訓練した敵対的生成ネットワークによる現実的な合成パスの生成

シミュレーション・モデルの選択は、微妙な形でモデル依存性をもたらします。ディープ・ヘッジングはヘッジング戦略が閉形式の公式から導出されないという意味ではモデルフリーですが、訓練データは依然として何らかのモデルから生成されます。訓練モデルが実際の市場ダイナミクスを十分に表現していなければ、学習された戦略のパフォーマンスが低下する可能性があります。これは活発な研究分野であり、最近では単一の仮定されたモデルではなく、さまざまな市場ダイナミクスの範囲にわたって良好なパフォーマンスを示す分布的にロバストなディープ・ヘッジングに関する研究が進められています。

実務への応用

オプション・デスク

最も直接的な応用は、銀行やマーケットメイカーのオプション・デスクです。これらのデスクは、複数の原資産、行使価格、満期にわたる大規模で複雑なオプション・ポートフォリオを保有しています。古典的ヘッジングでは、製品ごとに異なるモデルを使用して、ポートフォリオ全体のグリークス（デルタ、ガンマ、ベガ、セータ）を計算・管理する必要があります。ディープ・ヘッジングはポートフォリオ全体に対する統合的なヘッジング戦略を学習でき、クロスアセットの相関、取引コスト、デスク固有のリスク・リミットを自然に考慮します。

エキゾチック・デリバティブ

エキゾチック・デリバティブ——バリア・オプション、アジアン・オプション、オートコーラブル——については、古典的なヘッジング公式が存在しないか、厳しい近似が必要です。ディープ・ヘッジングは閉形式の解を必要とせず、シミュレーションされたペイオフから直接効果的な戦略を学習できます。

リスク管理

ヘッジングの領域を超えて、このフレームワークはリスク測定にも示唆を与えます。ディープ・ヘッジング戦略の下でのヘッジングP&Lの分布は、ほとんどのリスク・システムで使用される標準的なグリークス・ベースの近似よりも、残余リスクについてより現実的な像を提供します。

限界と課題

ディープ・ヘッジングは強力ですが、重大な実務的課題がないわけではありません。

計算コスト。 ディープ・ヘッジング・モデルの訓練には、数千の価格パスのシミュレーションと、それらに対するニューラルネットワークの最適化が必要です。複雑なポートフォリオの場合、計算負荷は大きくなり得ますが、GPUコンピューティングの進歩により実用性は増しています。

解釈可能性。 ニューラルネットワークのヘッジング判断は不透明です。モデルが特定のシナリオでアンダーヘッジを選択した場合、その理由がすぐにはわかりません。この解釈可能性の欠如は、ヘッジがなぜ特定の方法で構築されたのかを理解したいリスク管理者や規制当局にとって不安材料となり得ます。ディープ・ヘッジングのための説明可能なAIに関する最近の研究がこの課題に取り組んでいますが、依然としてオープンな課題です。

シミュレーションの忠実度。 戦略の品質は訓練シミュレーションの品質に左右されます。シミュレーションが実際の市場ダイナミクスの重要な特徴——流動性の枯渇、相関レジームの変化、市場マイクロストラクチャーの効果——を捉えていなければ、学習された戦略はまさに最も重要な場面で失敗する可能性があります。

規制上の受容。 金融規制当局はブラックボックス・モデルに対して慎重です。ディープ・ヘッジングはバックテストやシミュレーションで有望な結果を示していますが、多くの管轄区域において本番運用のための規制承認を得ることは依然として障壁となっています。

より大きな展望

ディープ・ヘッジングは、クオンツ・ファイナンスにおけるより大きな潮流を象徴しています：モデル駆動からデータ駆動へのアプローチの転換です。古典的なクオンツ・ファイナンスは、優美な数学的モデル——ブラック・ショールズ、CAPM、ファーマ・フレンチ・モデル——から出発し、最適戦略を解析的に導出しました。ディープ・ヘッジングと関連する機械学習アプローチは逆の方向から始まります：目的を定義し、現実的なデータを提供し、アルゴリズムに戦略を発見させるのです。

これは古典的モデルが時代遅れになることを意味するものではありません。ブラック・ショールズはクォーティングの慣行、リスク・コミュニケーションの言語、そして一次近似として依然として貴重です。しかし、実際の摩擦が存在する実際の市場でのヘッジングにおいては、データ駆動のアプローチがますます競争力を持つようになっています。問いは、ニューラルネットワークがヘッジングにおいてブラック・ショールズに取って代わるかどうかではなく、統合がどれほど早く進み、規制の枠組みがどのように適応するかです。

個人投資家にとっての直接的な影響は限定的です——デリバティブ・ポートフォリオを取引する個人はほとんどいません。しかし間接的な効果は大きなものがあります。マーケットメイカーのヘッジングが改善されれば、日経225オプションなどのスプレッドが狭まり、オプション市場がより効率的になります。より正確なリスク管理はシステミック・リスクの低減を意味します。そして、理想化された仮定ではなく現実から出発するという知的フレームワークは、デリバティブを超えて、最適執行からポートフォリオ構築まで幅広い応用可能性を持っています。

本記事は教育目的で執筆されたものであり、金融投資の助言を構成するものではありません。過去の運用実績は将来の成果を保証するものではありません。

参考文献

Buehler, H., Gonon, L., Teichmann, J., & Wood, B. (2019). Deep Hedging. Quantitative Finance, 19(8), 1271-1291. https://doi.org/10.1080/14697688.2019.1571683
Black, F., & Scholes, M. (1973). The Pricing of Options and Corporate Liabilities. Journal of Political Economy, 81(3), 637-654. https://doi.org/10.1086/260062
Cao, J., Chen, J., Hull, J., & Poulos, Z. (2021). Deep Hedging of Derivatives Using Reinforcement Learning. Journal of Financial Data Science, 3(1), 10-27. https://doi.org/10.3905/jfds.2020.1.052
Horvath, B., Teichmann, J., & Zuric, Z. (2021). Deep Hedging under Rough Volatility. Quantitative Finance, 21(2), 235-247. https://doi.org/10.1080/14697688.2020.1817974