什麼是Merton模型，它為何對信用風險重要？

Merton（1974）模型將企業股權視為企業資產上的買權，債務面值為履約價格。當資產價值在到期日低於債務時發生違約。透過反解Black-Scholes公式，模型從可觀測的股價中推斷企業資產價值和波動率，然後計算違約距離（distance-to-default）指標。KMV/穆迪將其商業化為預期違約頻率（EDF）估計值，在實務中廣泛使用。模型的優勢在於經濟基礎，劣勢在於Eom、Helwege和Huang（2004）記錄的持續實證錯誤定價。

結構模型和約化形式信用模型有什麼區別？

結構模型（Merton 1974）將違約與企業經濟基本面聯繫起來：當資產價值低於債務時發生違約。需要從股價推斷不可觀測的資產價值，並對違約機制施加假設。約化形式模型（Jarrow-Turnbull 1995; Duffie-Singleton 1999）將違約視為具有隨機強度的泊松過程的首次到達。無需對資產動態進行假設，直接對可觀測信用利差進行校準。結構模型更適合基本面風險監測和壓力測試；約化形式模型在信用衍生品定價和構建違約調整折現率方面更易處理。

為什麼銀行不對所有信用風險建模都使用機器學習？

兩個障礙阻止了機器學習在受監管信用風險中的全面採用。第一是可解釋性：巴塞爾III/IV下的監管機構要求銀行解釋和審計其資本模型。擁有數百個特徵和數千棵樹的梯度提升模型無法像Z-score或結構模型那樣被解釋。第二是資料可用性：由於違約是罕見事件，企業違約資料集規模較小。這些限制意味著機器學習在監管寬鬆的環境（金融科技貸款機構、避險基金）和作為可解釋模型的補充工具時最為有用。

信用風險建模：從Merton結構模型到機器學習

核心結論

信用風險建模從Merton（1974）優雅的選擇權理論框架開始，經過約化形式強度模型，發展到現代機器學習流水線。每一代都提高了預測精度，但也放棄了一些重要的東西：結構模型以實證配適換取經濟直覺；約化形式模型獲得易處理性，但失去了企業資產負債表作為錨點；機器學習提高了精度，但犧牲了可解釋性，且往往失去監管接受度。實務者很少只選擇一種典範，而是將三者結合，在各自發揮最大價值的領域加以運用。

股票市場正在重新定價信用風險

隨著地緣政治不確定性在2025年至2026年間壓縮全球風險偏好，投資等級和高收益公司債的信用利差大幅走闊。這一動向再次引發了資產管理公司、銀行風險部門和債券投資者持續面臨的問題：如何估計交易對手違約的機率，以及承擔該風險需要多少補償？

答案在很大程度上取決於所選擇的建模框架，而每個框架背後都有七十年的研究積累，決定了它能看到什麼，又不能看到什麼。

Merton（1974）：將股權視為企業資產的買權

Merton（1974）的核心洞見簡潔而深刻。企業的股權在經濟上等價於企業資產上的歐式買權，債務面值為履約價格。如果到期時企業資產價值超過債務，股東獲得剩餘部分。如果資產跌破債務，股東一無所獲，債權人承擔損失。

這一框架將違約問題轉化為選擇權定價問題。利用可觀測的股價和波動率，Merton透過反解Black-Scholes公式，推斷出企業資產價值和資產波動率。當資產價值過程（建模為幾何布朗運動）在到期日跌破債務面值時，違約發生。

違約距離（DD）將這一點概括為一個直觀的指標：

DD = (V - F) / (V × sigma_V)

其中V是估計資產價值，F是違約邊界（通常為債務面值），sigma_V是資產波動率。違約距離為5的企業需要資產發生5個標準差的不利波動才會違約，而違約距離為1的企業已經接近懸崖邊緣。

KMV公司（後被穆迪收購）在1980年代末至1990年代將這一洞見商業化。KMV模型透過在大型歷史資料庫中將違約距離值對應到實證違約率，來估計預期違約頻率（EDF）。核心公式得以保留，但從DD到EDF的對應是實證性而非理論性的。

結構模型的實證缺陷

儘管結構模型十分優雅，Merton框架存在持續的實證問題。Eom、Helwege和Huang（2004）對五種結構性信用模型（包括Merton (1974)以及Leland (1994)和Longstaff-Schwartz (1995)的擴展）與實際公司債券收益率利差進行了系統性評估。

他們的核心發現是，結構模型系統性地對公司債券錯誤定價。原始Merton模型預測的利差對大多數債券而言過低，差距往往很大。更複雜的結構模型解決了部分低估問題，但引入了新問題：它們對高風險企業的利差又存在高估。沒有單一結構模型能在整個評級譜系中產生校準良好的利差預測。

這一實證失敗背後有三個結構性問題。第一，模型假設違約只能在債務到期時發生，而實際上企業隨時可能陷入財務困境。第二，幾何布朗運動對企業資產動態的描述較差；跳躍、均值回歸和隨機波動率都很重要。第三，模型將債務到期視為既定，忽視了真實企業所面臨的複雜資本結構、契約結構和策略性違約誘因。

這些不是細枝末節的校準問題，而是理論易處理性與實證真實性之間根本張力的體現。

約化形式模型：強度與風險率

Jarrow和Turnbull（1995）獨立開發、Duffie和Singleton（1999）加以擴展的約化形式（或強度型）方法，完全放棄了與企業資產的結構性聯繫。相反，違約被建模為具有隨機強度參數（通常表示為lambda）的泊松過程的首次到達。

風險率（或違約強度）lambda(t)是在已存活至時刻t的條件下，瞬間發生違約的條件機率。若lambda(t)遵循已知過程，則在已存活至時刻t的條件下存活至時刻T的機率為：

P(存活至T) = E[exp(-從t到T的lambda(s) ds的積分)]

這一公式在數學上類似於短期利率模型中零息債券的定價。事實上，Duffie和Singleton（1999）表明，可違約債券可以完全像包含違約強度和違約損失率的修正折現率的無風險債券一樣定價。這在風險率過程的仿射規格下產生了實用的封閉形式解。

相較於結構模型，其實用優勢相當顯著。第一，約化形式模型無需推斷不可觀測的企業資產價值，可直接利用簡單的收益率曲線剝離技術對可觀測的信用利差進行校準。第二，它能自然地處理複雜的違約機率期限結構。第三，可以在相同的數學框架內擴展，以容納相關違約和信用衍生品定價。

代價是喪失經濟內容。風險率lambda(t)是一個描述違約何時發生的統計物件，對於為什麼發生或哪些企業層面的變數驅動它，沒有任何說明。

阿爾特曼Z值：機器學習的雛形分類器

在現代機器學習出現之前，有Z值。Altman（1968）使用多元判別分析構建了五個財務比率的線性函數，將破產企業與非破產企業區分開來：

Z = 1.2 X1 + 1.4 X2 + 3.3 X3 + 0.6 X4 + 1.0 X5

其中X1是營運資金/總資產，X2是保留盈餘/總資產，X3是息稅前利潤/總資產，X4是股權市值/總負債帳面價值，X5是銷售收入/總資產。

Z值高於2.99的企業被歸類為安全區；低於1.81的被歸類為危險區；中間的灰色地帶則模糊不清。Altman的原始樣本在破產前一年實現了約95%的分類準確率。

從現代機器學習的視角來看，Z值是用判別分析在小型標記資料集上訓練的線性分類器。其特徵集合理：捕捉了流動性（X1）、獲利能力（X2、X3）、槓桿（X4）和資產效率（X5）。其限制同樣明顯：線性、僅使用五個特徵、需要跨時期和行業重新校準，且是為不同總體經濟時代的製造業企業設計的。

Z值之所以被廣泛引用和使用，並非因為它是最先進的，而是因為其可解釋性使其在監管申報、契約監控和投資組合篩選等需要可稽核性的場合中十分有用。

機器學習：梯度提升帶來了什麼

向梯度提升決策樹（尤其是XGBoost和LightGBM）的轉變，相較於經典判別模型和邏輯回歸帶來了三項實質性改進。

第一，非線性。財務比率以複雜方式相互作用；高槓桿企業在高利率環境中危險，但在低利率時尚可管理。基於樹的模型無需分析師事先指定便能捕捉這些交互。

第二，特徵豐富性。現代ML信用模型吸收會計資料、市場資料（股價、股票波動率、信用利差）、總體經濟指標、產業指標，某些實現中還包括來自業績發布和申報文件的文字特徵。Merton模型使用兩個輸入，現代梯度提升模型可能使用200個以上。

第三，處理缺失和不平衡資料。企業違約是罕見事件。梯度提升實現透過樣本加權和成本敏感損失函數原生處理類別不平衡，這在信用分類中至關重要，因為假陰性（遺漏的違約）的代價遠高於假陽性。

實證效果是真實的。在多項研究和信用資料集中，梯度提升在樣本外違約預測指標（如ROC曲線下面積AUC和Kolmogorov-Smirnov統計量）上一致優於邏輯回歸和Altman式判別模型。在富含市場特徵的資料集上，比邏輯回歸通常提升5至10個AUC點。

代價是可解釋性。擁有500棵樹和數百個特徵的梯度提升模型無法像Z值那樣被稽核。

神經風險率模型

最新的方法論前沿將神經網路應用於風險率建模框架，將約化形式模型的數學結構與深度學習的表達能力相結合。

Kvamme等（2019）及相關研究使用神經網路架構重新表述了離散時間風險率模型。網路學習共變量到每個時間步條件違約機率的對應，而非指定風險函數的參數形式。這使模型能在不受仿射強度模型限制性函數形式假設約束的情況下，捕捉企業層面和總體經濟變數對風險率的非線性影響。

Gunnarsson等（2021）將類似框架具體應用於企業信用風險，發現神經風險率模型在長期違約預測上優於邏輯回歸和梯度提升，在風險率的時間動態最為重要的情境中尤為突出。這一優勢在財務困境早期階段的企業中特別明顯，因為契約壓力和現金消耗的時間路徑提供了橫截面快照所無法捕捉的資訊。

循環架構（LSTM、GRU）直接處理時間結構。循環網路處理財務報表和市場價格的時間序列，學習哪些軌跡先於違約出現，而非向模型輸入單一期間的財務比率快照。這更接近有經驗的信用分析師非正式所做的事情：他們不只看最新的申報文件，而是審視趨勢。

代價是對資料的大量需求。神經模型需要比梯度提升大得多的訓練樣本以避免過度配適，而由於違約的稀缺性，企業違約資料集本身就受到限制。

實務者框架：什麼在哪裡被使用？

框架	可解釋性	資料需求	違約預測	監管接受度
Merton / KMV	高	市場 + 資產負債表	中等	高
約化形式	中	信用利差	高（用於定價）	高
Altman Z值	非常高	僅會計	中等	非常高
梯度提升	低至中	會計 + 市場	高	中
神經風險率	低	大型縱橫資料	最高	低

銀行和大型資產管理公司的投資等級信用評估通常依賴KMV方式的EDF估計與判斷性覆蓋的組合。結構模型提供經濟上有據可查的錨點；分析師則針對模型無法看到的因素（管理品質、訴訟風險、策略定位）進行調整。

高收益和槓桿貸款部門越來越多地將梯度提升模型與傳統基本面分析結合使用。模型識別需要更密切關注的異常值；分析師判斷模型的擔憂是否反映了真實惡化或資料雜訊。

不良債務和信用特殊情況實務者通常最依賴自下而上的基本面分析和結構模型輸出。

量化信用避險基金和金融科技貸款機構是神經風險率模型的主要採用者。他們擁有支持這些模型所需的資料量和技術基礎設施，並且比受監管銀行面臨更少的模型形式監管約束。

每種模型的失去

理解每種模型犧牲了什麼，與理解它獲得了什麼同樣重要。Merton模型施加了特定的經濟結構；當該結構錯誤時（對於資本結構複雜的企業往往如此），模型系統性地而非隨機地失敗。約化形式模型對市場價格配適良好，但對違約機制沉默無言；在市場價格變動之前，它無法預警基本面的惡化。梯度提升功能強大但非因果；它學習訓練資料中模式與違約的相關關係，當經濟體制轉換時，這些相關關係可能在樣本外崩潰。神經模型在時間維度上擴展了這些能力，但加劇了可解釋性和資料要求的問題。

這些框架沒有一個是錯誤的，每個都是對相同複雜經濟現實的不同近似。

限制

所有類型的信用模型都有共同限制。違約資料集相對於其所試圖支持的模型複雜性而言規模偏小；即使有數十年的資料，投資等級違約也足夠罕見，使樣本外驗證不可靠。在一個信用循環中訓練的模型可能在下一個循環產生系統性偏差的預測。信用風險與系統性風險之間的相互作用（違約在經濟衰退期間集中的傾向）難以在沒有總體經濟成分的情況下建模，而大多數信用模型將總體環境視為共變量而非共同演化的狀態。

監管要求施加了單獨的約束。受巴塞爾III/IV約束的銀行必須使用滿足可解釋性和可稽核性標準的模型，這實際上排除了深度神經網路用於監管資本計算，即使這些網路展示了更優越的樣本外表現。學術前沿與監管前沿並不總是處於同一位置。

參考文獻

Merton, R.C. (1974). "On the Pricing of Corporate Debt: The Risk Structure of Interest Rates." Journal of Finance, 29(2), 449-470. https://doi.org/10.1111/j.1540-6261.1974.tb03058.x
Altman, E.I. (1968). "Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy." Journal of Finance, 23(4), 589-609. https://doi.org/10.1111/j.1540-6261.1968.tb00843.x
Jarrow, R.A. & Turnbull, S.M. (1995). "Pricing Derivatives on Financial Securities Subject to Credit Risk." Journal of Finance, 50(1), 53-85. https://doi.org/10.1111/j.1540-6261.1995.tb05167.x
Duffie, D. & Singleton, K.J. (1999). "Modeling Term Structures of Defaultable Bonds." Review of Financial Studies, 12(4), 687-720. https://doi.org/10.1093/rfs/12.4.687
Eom, Y.H., Helwege, J. & Huang, J. (2004). "Structural Models of Corporate Bond Pricing: An Empirical Analysis." Review of Financial Studies, 17(2), 499-544. https://doi.org/10.1093/rfs/hhg053
Kvamme, H., Foss, N., Borgan, O. & Scheel, I. (2019). "Time-to-event prediction with neural networks and Cox regression." KDD 2019. https://doi.org/10.1145/3292500.3330687
Gunnarsson, B.R., Vanden Broucke, S., Baesens, B., Óskarsdóttir, M. & Lemahieu, W. (2021). "Deep learning for credit scoring: Do or don't?" Expert Systems with Applications, 177, 114722. https://doi.org/10.1016/j.eswa.2021.114722