マートンモデルとは何ですか？信用リスクにとってなぜ重要なのですか？

Merton（1974）モデルは、企業の自己資本を資産に対するコールオプションとして扱い、負債額面をストライク価格とします。満期時に資産価値が負債を下回った場合にデフォルトが発生します。ブラック-ショールズ公式を逆算することで、観測可能な株価から企業の資産価値と変動性を推定し、デフォルトリスクを要約するデフォルトまでの距離（distance-to-default）指標を計算します。KMV/ムーディーズはこれを商業化し、予想デフォルト頻度（EDF）推定値として実務で広く活用されています。モデルの強みは経済的根拠であり、弱みはEom、Helwege、Huang（2004）が記録した継続的な実証的誤価格です。

構造モデルとリデューストフォーム信用モデルの違いは何ですか？

構造モデル（Merton 1974）はデフォルトを企業の経済的基礎に結びつけます。資産価値が負債を下回るとデフォルトが発生します。株価から観測不可能な資産価値を推定し、デフォルトメカニズムについての仮定を課す必要があります。リデューストフォームモデル（Jarrow-Turnbull 1995; Duffie-Singleton 1999）はデフォルトを確率的強度を持つポアソン過程の最初の到来として扱います。資産ダイナミクスに関する仮定なしに、観測可能なクレジットスプレッドに直接キャリブレーションされます。構造モデルはファンダメンタル・リスク監視とストレステストに優れ、リデューストフォームモデルはクレジットデリバティブの価格付けと不履行調整割引率の構築に扱いやすいです。

なぜ銀行はすべての信用リスクモデリングに機械学習を使わないのですか？

規制された信用リスクにおけるML全面採用を妨げる二つの障壁があります。第一に解釈可能性：バーゼルIII/IVの規制当局は銀行に資本モデルの説明と監査を求めます。数百の特徴と数千の木を持つ勾配ブースティングモデルは、Zスコアや構造モデルのように説明できません。第二にデータ可用性：企業のデフォルトデータセットはデフォルトがまれな事象であるため規模が小さいです。これらの制約により、MLは規制が緩い環境（フィンテック貸し手、ヘッジファンド）と解釈可能なモデルの補完ツールとして最も有用です。

信用リスクモデリング：マートンの構造モデルから機械学習まで

核心的な結論

信用リスクモデリングは、Merton（1974）の優雅なオプション理論的枠組みから始まり、1990年代のリデューストフォーム・ハザードモデルを経て、現代の機械学習パイプラインへと発展してきました。各世代は予測精度を高めますが、何か重要なものと引き換えになります。構造モデルは経済的直感のために実証的な適合度を犠牲にし、リデューストフォームモデルは扱いやすさを得る一方で企業のバランスシートというアンカーを失い、機械学習は精度を高めますが解釈可能性を手放します。実務家は三つを組み合わせ、それぞれが最も効果的な場面で活用するのが標準的なアプローチです。

株式市場が信用リスクを再評価しました

2025年から2026年にかけて、地政学的不確実性がグローバルなリスク選好度を圧迫する中、投資適格および高利回り社債のクレジットスプレッドが大幅に拡大しました。この動きにより、資産運用会社、銀行のリスクデスク、債券投資家が継続的に直面する問いに再び注目が集まっています。取引相手がデフォルトする確率をどのように推定し、そのリスクを負うためにどれだけの報酬が必要かという問いです。

答えは、選択するモデルの枠組みに大きく依存します。そして各枠組みには、何を見ることができ、何を見ることができないかを決定する70年の研究の歴史があります。

Merton（1974）：株式を企業資産に対するコールオプションとして

Merton（1974）の核心的な洞察はシンプルでありながら深遠です。企業の株式は経済的に、企業資産に対するヨーロッパ型コールオプションと等価であり、負債の額面価値がストライク価格となります。満期時に企業の資産価値が負債を超えれば、株主は残余分を受け取ります。資産が負債を下回れば、株主は何も受け取れず、債権者が損失を吸収します。

この枠組みは、デフォルト問題をオプション価格決定問題に変換します。観測可能な株価と変動性を使って、Mertonはブラック-ショールズ公式を逆算することで企業の資産価値と資産変動性を推定できることを示しました。デフォルトは、幾何ブラウン運動としてモデル化された資産価値プロセスが満期日に負債額面を下回ったときに発生します。

デフォルトまでの距離（DD）はこれを一つの直感的な指標に要約します。

DD = (V - F) / (V × sigma_V)

ここでVは推定資産価値、Fはデフォルト境界（通常は負債の額面価値）、sigma_Vは資産変動性です。DDが5の企業がデフォルトするには、資産に5標準偏差の不利な変動が必要です。DDが1の企業はすでに崖の端に近い状態です。

KMV社（その後ムーディーズに買収）は、1980年代後半から1990年代にかけてこの洞察を商業化しました。KMVモデルは、大規模な歴史的データベースでデフォルトまでの距離の値を実証的なデフォルト率に対応させることで予想デフォルト頻度（EDF）を推定します。核心的な公式は維持されますが、DDからEDFへの対応は理論的ではなく実証的です。

構造モデルの実証的な限界

その優雅さにもかかわらず、Merton枠組みには根強い実証的問題があります。Eom、Helwege、Huang（2004）は、Merton（1974）およびLeland（1994）、Longstaff-Schwartz（1995）の拡張を含む5つの構造的信用モデルを、実際の社債利回りスプレッドと体系的に比較評価しました。

彼らの中心的な発見は、構造モデルが社債を体系的に誤価格設定するというものです。元のMertonモデルは、ほとんどの債券について実際より低すぎるスプレッドを予測する傾向があり、差が大きい場合も多くあります。より精緻な構造モデルは過小予測問題の一部を解決しますが、新たな問題をもたらします。すなわち、リスクの高い企業についてはスプレッドを過大予測します。格付けスペクトル全体にわたって適切に校正されたスプレッド予測を生成する単一の構造モデルは存在しません。

この実証的な失敗の背景には、三つの構造的問題があります。第一に、モデルはデフォルトが負債の満期時のみに発生できると仮定しますが、実際には企業はいつでも財務的困難に陥る可能性があります。第二に、幾何ブラウン運動は企業資産ダイナミクスを適切に表現できません。ジャンプ、平均回帰、確率的変動性がすべて重要です。第三に、モデルは負債の満期を所与とし、実際の企業が直面する複雑な資本構造、契約条件、戦略的デフォルトの誘因を無視します。

これらは些細な校正上の問題ではありません。理論的な扱いやすさと実証的な忠実性の間の根本的な緊張を反映しています。

リデューストフォームモデル：強度とハザードレート

JarrowとTurnbull（1995）が独立して開発し、DuffieとSingleton（1999）が拡張したリデューストフォーム（または強度ベース）アプローチは、企業資産との構造的な結びつきを完全に放棄します。代わりに、デフォルトは確率的強度パラメータ（しばしばラムダと表記）を持つポアソン過程の最初の到来としてモデル化されます。

ハザードレート（またはデフォルト強度）lambda(t)は、時刻tまでの生存を条件とした瞬間的な条件付きデフォルト確率です。lambda(t)が既知のプロセスに従う場合、時刻tからTまでの生存確率は次のようになります。

P(Tまでの生存) = E[exp(-tからTのlambda(s) dsの積分)]

この公式は数学的に、短期金利モデルにおけるゼロクーポン債の価格決定と類似しています。実際、DuffieとSingleton（1999）は、デフォルト可能な債券が、デフォルト強度と損失率を組み込んだ修正割引率を使用する無リスク債券とまったく同じように価格決定できることを示しました。これにより、ハザードプロセスのアフィン定式化の下で実用的な閉形式解が得られます。

構造モデルに比べた実用的な利点は相当なものです。第一に、リデューストフォームモデルは観測不可能な企業資産価値を推定する必要なく、単純なイールドカーブ・ストリッピング手法を使って観測可能なクレジットスプレッドに直接校正できます。第二に、デフォルト確率の複雑な期間構造を自然に処理します。第三に、同じ数学的枠組みの中で相関したデフォルトとクレジットデリバティブ価格決定に対応するよう拡張できます。

トレードオフは経済的内容の喪失です。ハザードレートlambda(t)は、デフォルトがいつ発生するかを説明する統計的対象であり、なぜ発生するのか、あるいはどの企業レベルの変数がそれを引き起こすのかについては何も語りません。

アルトマンのZスコア：機械学習の原型分類器

現代の機械学習以前には、Zスコアがありました。Altman（1968）は多重判別分析を用いて、5つの財務比率の線形関数を構築し、破産企業と非破産企業を区別しました。

Z = 1.2 X1 + 1.4 X2 + 3.3 X3 + 0.6 X4 + 1.0 X5

ここでX1は運転資本/総資産、X2は留保利益/総資産、X3はEBIT/総資産、X4は自己資本の時価/総負債の簿価、X5は売上高/総資産です。

Zが2.99以上の企業は安全ゾーン、1.81以下の企業は危険ゾーンに分類されます。その間のグレーゾーンは曖昧です。Altmanの元のサンプルは、破産の1年前に約95%の分類精度を達成しました。

現代の機械学習の観点から見ると、Zスコアは判別分析を用いて小規模なラベル付きデータセットで訓練された線形分類器です。その特徴セットは合理的です。流動性（X1）、収益性（X2、X3）、レバレッジ（X4）、資産効率（X5）を捉えています。限界も明確です。線形であり、5つの特徴のみを使用し、時代と産業にわたって再校正が必要で、異なる経済時代の製造業企業向けに設計されています。

Zスコアは最先端であるからではなく、解釈可能性により規制申告、契約条件モニタリング、監査可能性が重要なポートフォリオスクリーニングに有用であるため、依然として広く引用され使用されています。

機械学習：勾配ブースティングが追加したもの

勾配ブースティング決定木（特にXGBoostとLightGBM）への移行は、古典的な判別モデルとロジスティック回帰に比べて三つの実質的な改善をもたらしました。

第一に、非線形性です。財務比率は複雑な形で相互作用します。高いレバレッジを持つ企業は高金利環境では危険ですが、金利が低いときは管理可能です。ツリーベースのモデルはこれらの相互作用をアナリストが事前に指定しなくても捉えます。

第二に、特徴の豊富さです。現代のML信用モデルは、会計データ、市場データ（株価、株式変動性、クレジットスプレッド）、マクロ経済指標、産業指標を取り込み、一部の実装では決算発表や開示書類からのテキスト特徴も含みます。Mertonモデルは2つの入力を使いますが、現代の勾配ブースティングモデルは200以上を使う場合もあります。

第三に、欠損および不均衡データの処理です。企業のデフォルトはまれな事象です。勾配ブースティングの実装はサンプル重み付けとコスト感応型損失関数によってクラス不均衡をネイティブに処理します。これは偽陰性（見逃したデフォルト）が偽陽性よりはるかにコストがかかる信用分類において非常に重要です。

実証的な成果は本物です。複数の研究と信用データセットにわたって、勾配ブースティングはROC曲線下面積（AUC）やコルモゴロフ-スミルノフ（KS）統計量などの標本外デフォルト予測指標において、ロジスティック回帰とAltman方式の判別モデルを一貫して上回ります。豊富な市場特徴を持つデータセットでは、ロジスティック回帰に対して通常5〜10 AUCポイントの改善が一般的です。

コストは解釈可能性です。500本の木と数百の特徴を持つ勾配ブースティングモデルは、Zスコアのように監査できません。

ニューラル・ハザードモデル

最も最近の方法論的最前線は、神経ネットワークをハザードモデリングの枠組みに適用し、リデューストフォームモデルの数学的構造とディープラーニングの表現力を組み合わせています。

Kvamme et al.（2019）と関連研究は、神経ネットワークアーキテクチャを使用して離散時間ハザードモデルを再定式化します。ハザード関数の参数的形式を指定する代わりに、ネットワークは各時間ステップで共変量から条件付きデフォルト確率へのマッピングを学習します。これにより、アフィン強度モデルの制約的な関数形式の仮定なしに、ハザードレートに対する企業レベルおよびマクロ変数の非線形効果を捉えることができます。

Gunnarsson et al.（2021）は同様の枠組みを企業信用リスクに具体的に適用し、ニューラル・ハザードモデルがハザードレートの時間的ダイナミクスが最も重要な長期デフォルト予測において、ロジスティック回帰と勾配ブースティングの両方を上回ることを発見しました。この優位性は、横断面的なスナップショットが見逃す方法で契約条件の圧力と現金消費の時間経路が情報を提供する財務ストレスの初期段階の企業で特に顕著です。

再帰的アーキテクチャ（LSTM、GRU）は時間的構造を直接処理します。モデルに財務比率の単一期間スナップショットを入力する代わりに、再帰的ネットワークは財務諸表と市場価格の時系列を処理し、デフォルトに先行するパターンを学習します。これは経験豊富な信用アナリストが非公式に行うことに近いです。最新の開示書類だけでなく、トレンドを見るのです。

トレードオフはデータ需要です。ニューラルモデルは過適合を避けるために勾配ブースティングよりもはるかに大きな訓練サンプルを必要とし、企業デフォルトデータセットはデフォルトの希少性により本質的に限られています。

実務家の枠組み：何がどこで使われていますか？

枠組み	解釈可能性	データ要件	デフォルト予測	規制上の受容性
Merton / KMV	高い	市場 + バランスシート	中程度	高い
リデューストフォーム	中程度	クレジットスプレッド	高い（価格決定用）	高い
AltmanのZスコア	非常に高い	会計のみ	中程度	非常に高い
勾配ブースティング	低〜中程度	会計 + 市場	高い	中程度
ニューラル・ハザード	低い	大規模パネルデータ	最も高い	低い

銀行と大型資産運用会社の投資適格信用評価は、通常KMV方式のEDF推定値と判断的なオーバーレイを組み合わせる傾向があります。構造モデルが経済的に根拠のあるアンカーを提供し、アナリストがモデルでは見えない要因（経営品質、訴訟リスク、戦略的ポジション）を調整します。

高利回りおよびレバレッジドローンのデスクは、従来のファンダメンタル分析と並んで、ますます勾配ブースティングモデルを使用するようになっています。モデルがより詳細な注意が必要な外れ値を特定し、アナリストがモデルの懸念が実際の悪化を反映しているのかデータアーティファクトなのかを判断します。

不良債権と信用スペシャル・シチュエーションの実務家は、一般的にボトムアップのファンダメンタル分析と構造モデルの出力に最も依存します。

定量的な信用ヘッジファンドとフィンテック貸し手が、ニューラル・ハザードモデルの主要採用者です。彼らはこれらのモデルをサポートするデータ量と技術インフラを持ち、規制銀行よりもモデル形式に関する規制上の制約が少ないです。

各モデルが失うもの

各モデルが何を犠牲にするかを理解することは、何を得るかを理解することと同様に重要です。Mertonモデルは特定の経済的構造を課します。その構造が誤っている場合（特に複雑な資本構造を持つ企業では頻繁にそうなります）、モデルはランダムではなく体系的に失敗します。リデューストフォームモデルは市場価格によく適合しますが、デフォルトのメカニズムについては沈黙しています。勾配ブースティングは強力ですが非因果的です。訓練データのパターンとデフォルトとの相関関係を学習し、経済体制が転換するとその相関関係が標本外で崩壊する可能性があります。

これらの枠組みのどれも間違っていません。それぞれが同じ複雑な経済的現実に対する異なる近似です。

限界

あらゆるタイプの信用モデルは共通の限界を持ちます。デフォルトデータセットは、サポートしようとするモデルの複雑さに比べて小さいです。数十年のデータがあっても、投資適格デフォルトは標本外検証を信頼性のないものにするほどまれです。あるクレジットサイクルで訓練されたモデルは、次のサイクルで体系的に偏った予測を生成する可能性があります。信用リスクとシステミックリスク（不況期にデフォルトが集中する傾向）の相互作用は、マクロ成分なしでモデル化するのが困難です。

規制要件が別の制約を課します。バーゼルIII/IVの適用を受ける銀行は、解釈可能性と監査可能性の基準を満たすモデルを使用しなければなりません。これにより、深層神経ネットワークが標本外パフォーマンスで優れていても、規制上の資本計算には効果的に使用することが難しくなります。

参考文献

Merton, R.C. (1974). "On the Pricing of Corporate Debt: The Risk Structure of Interest Rates." Journal of Finance, 29(2), 449-470. https://doi.org/10.1111/j.1540-6261.1974.tb03058.x
Altman, E.I. (1968). "Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy." Journal of Finance, 23(4), 589-609. https://doi.org/10.1111/j.1540-6261.1968.tb00843.x
Jarrow, R.A. & Turnbull, S.M. (1995). "Pricing Derivatives on Financial Securities Subject to Credit Risk." Journal of Finance, 50(1), 53-85. https://doi.org/10.1111/j.1540-6261.1995.tb05167.x
Duffie, D. & Singleton, K.J. (1999). "Modeling Term Structures of Defaultable Bonds." Review of Financial Studies, 12(4), 687-720. https://doi.org/10.1093/rfs/12.4.687
Eom, Y.H., Helwege, J. & Huang, J. (2004). "Structural Models of Corporate Bond Pricing: An Empirical Analysis." Review of Financial Studies, 17(2), 499-544. https://doi.org/10.1093/rfs/hhg053
Kvamme, H., Foss, N., Borgan, O. & Scheel, I. (2019). "Time-to-event prediction with neural networks and Cox regression." KDD 2019. https://doi.org/10.1145/3292500.3330687
Gunnarsson, B.R., Vanden Broucke, S., Baesens, B., Óskarsdóttir, M. & Lemahieu, W. (2021). "Deep learning for credit scoring: Do or don't?" Expert Systems with Applications, 177, 114722. https://doi.org/10.1016/j.eswa.2021.114722