Apa itu model Merton dan mengapa penting untuk risiko kredit?

Model Merton (1974) memperlakukan ekuitas perusahaan sebagai call option atas asetnya, dengan nilai nominal utang sebagai strike price. Default terjadi ketika nilai aset turun di bawah utang pada saat jatuh tempo. Dengan membalik rumus Black-Scholes, model menyimpulkan nilai aset dan volatilitas perusahaan dari harga ekuitas yang dapat diamati, kemudian menghitung metrik distance-to-default. KMV/Moody's mengkomersialisasikan ini menjadi estimasi expected default frequency (EDF) yang banyak digunakan dalam praktik.

Apa perbedaan antara model kredit struktural dan reduced-form?

Model struktural (Merton 1974) menghubungkan default dengan fundamental ekonomi perusahaan: default terjadi ketika nilai aset turun di bawah utang. Model reduced-form (Jarrow-Turnbull 1995; Duffie-Singleton 1999) memperlakukan default sebagai kedatangan pertama proses Poisson dengan intensitas stokastik. Model struktural lebih baik untuk pemantauan risiko fundamental; model reduced-form lebih mudah ditangani untuk penetapan harga derivatif kredit.

Mengapa bank tidak menggunakan machine learning untuk semua pemodelan risiko kredit?

Dua hambatan mencegah adopsi ML secara universal dalam risiko kredit yang diregulasi. Pertama, interpretabilitas: regulator di bawah Basel III/IV mengharuskan bank untuk menjelaskan dan mengaudit model modal mereka. Model gradient boosting dengan ratusan fitur dan ribuan pohon tidak dapat dijelaskan seperti Z-score atau model struktural. Kedua, ketersediaan data: dataset default perusahaan kecil karena default adalah peristiwa langka. Kendala ini membuat ML paling berguna dalam konteks yang kurang diregulasi (pemberi pinjaman fintech, hedge fund) dan sebagai alat pelengkap di samping model yang dapat diinterpretasi.

Pemodelan Risiko Kredit: Dari Model Struktural Merton hingga Machine Learning

Poin Utama

Pemodelan risiko kredit telah berkembang dari kerangka teori opsi yang elegan milik Merton (1974), melewati model hazard bentuk-tereduksi yang praktis pada era 1990-an, hingga pipeline machine learning modern yang memproses ratusan fitur. Setiap generasi menawarkan perbaikan nyata tetapi juga mengorbankan sesuatu yang berharga: model struktural mengorbankan kecocokan empiris demi intuisi ekonomi; model bentuk-tereduksi memperoleh kemudahan perhitungan tetapi kehilangan neraca perusahaan sebagai jangkar; machine learning memperoleh akurasi prediktif tetapi mengorbankan interpretabilitas dan, sering kali, penerimaan regulasi. Praktisi jarang memilih satu paradigma saja; mereka menggabungkannya, menggunakan masing-masing di tempat yang menghasilkan kerusakan paling sedikit.

Pasar Ekuitas Baru Saja Merevaluasi Risiko Kredit

Spread kredit pada utang korporasi investment-grade dan high-yield telah melebar secara tajam sepanjang 2025 dan memasuki 2026 seiring ketidakpastian geopolitik yang menekan selera risiko global. Pergerakan ini kembali menarik perhatian terhadap pertanyaan yang terus dihadapi oleh manajer aset, desk risiko bank, dan investor obligasi: bagaimana cara memperkirakan probabilitas bahwa pihak lawan mengalami gagal bayar, dan berapa kompensasi yang diperlukan untuk menanggung risiko tersebut?

Jawabannya sangat bergantung pada kerangka pemodelan yang dipilih, dan setiap kerangka memiliki silsilah penelitian selama tujuh puluh tahun yang menentukan apa yang dapat dan tidak dapat dilihatnya.

Merton (1974): Ekuitas sebagai Call Option atas Aset Perusahaan

Wawasan fundamental dari Merton (1974) tampak sederhana secara menipu. Ekuitas suatu perusahaan secara ekonomi setara dengan European call option atas aset perusahaan, dengan nilai nominal utang sebagai harga strike. Jika nilai aset perusahaan melebihi utangnya pada saat jatuh tempo, pemegang saham menerima sisanya. Jika aset turun di bawah utang, pemegang saham tidak menerima apa-apa dan pemegang obligasi menyerap kerugian.

Pembingkaian ini mengubah masalah gagal bayar menjadi masalah penetapan harga opsi. Dengan harga ekuitas dan volatilitas yang dapat diamati, Merton menunjukkan bahwa nilai aset perusahaan dan volatilitas aset dapat disimpulkan dengan membalik rumus Black-Scholes. Gagal bayar terjadi ketika proses nilai aset, yang dimodelkan sebagai gerak Brown geometris, melintas di bawah nilai nominal utang pada tanggal jatuh tempo.

Distance-to-default (DD) merangkum hal ini dalam satu metrik yang intuitif:

DD = (V - F) / (V x sigma_V)

di mana V adalah estimasi nilai aset, F adalah batas gagal bayar (biasanya nilai nominal utang), dan sigma_V adalah volatilitas aset. Perusahaan dengan DD sebesar 5 memerlukan pergerakan merugikan sebesar lima standar deviasi pada asetnya untuk mengalami gagal bayar. Perusahaan dengan DD sebesar 1 sudah berada dekat dengan jurang.

KMV Corporation (yang kemudian diakuisisi oleh Moody's) mengkomersialkan wawasan ini pada akhir 1980-an dan 1990-an. Model KMV memperkirakan expected default frequencies (EDFs) dengan memetakan nilai distance-to-default ke tingkat gagal bayar empiris di seluruh basis data historis yang besar. Rumus inti dipertahankan tetapi pemetaan dari DD ke EDF bersifat empiris, bukan teoretis.

Kekurangan Empiris Model Struktural

Terlepas dari keanggunannya, kerangka Merton memiliki masalah empiris yang persisten. Eom, Helwege, and Huang (2004) secara sistematis mengevaluasi lima model kredit struktural, termasuk Merton (1974) dan ekstensi oleh Leland (1994) serta Longstaff-Schwartz (1995), terhadap spread yield obligasi korporasi yang teramati.

Temuan sentral mereka adalah bahwa model struktural secara sistematis salah dalam menetapkan harga obligasi korporasi. Model Merton asli memprediksi spread yang terlalu rendah untuk sebagian besar obligasi, sering kali dengan margin yang besar. Model struktural yang lebih rumit memecahkan sebagian masalah underprediksi tetapi memperkenalkan masalah baru: mereka memprediksi spread terlalu tinggi untuk perusahaan berisiko. Tidak ada satu pun model struktural yang menghasilkan prediksi spread yang terkalibrasi dengan baik di seluruh spektrum peringkat.

Tiga masalah struktural mendasari kegagalan empiris ini. Pertama, model mengasumsikan bahwa gagal bayar hanya dapat terjadi pada saat jatuh tempo utang; dalam praktiknya, perusahaan dapat memasuki kesulitan keuangan kapan saja. Kedua, gerak Brown geometris merupakan deskripsi yang buruk tentang dinamika aset perusahaan; lompatan, mean reversion, dan volatilitas stokastik semuanya berpengaruh. Ketiga, model menganggap jatuh tempo utang sebagai hal yang tetap dan mengabaikan struktur modal yang kompleks, struktur covenant, dan insentif gagal bayar strategis yang dihadapi perusahaan nyata.

Ini bukan masalah kalibrasi kecil. Masalah-masalah ini mencerminkan ketegangan fundamental dalam model struktural antara kemudahan teoretis dan kesetiaan empiris.

Model Bentuk-Tereduksi: Intensitas dan Hazard Rate

Pendekatan bentuk-tereduksi (atau berbasis intensitas), yang dikembangkan secara independen oleh Jarrow and Turnbull (1995) dan diperluas oleh Duffie and Singleton (1999), meninggalkan hubungan struktural dengan aset perusahaan sepenuhnya. Sebaliknya, gagal bayar dimodelkan sebagai kedatangan pertama dari proses Poisson dengan parameter intensitas stokastik, yang sering dilambangkan dengan lambda.

Hazard rate (atau intensitas gagal bayar) lambda(t) adalah probabilitas kondisional sesaat dari gagal bayar mengingat kelangsungan hidup hingga waktu t. Jika lambda(t) mengikuti proses yang diketahui, maka probabilitas bertahan hingga waktu T mengingat kelangsungan hidup hingga waktu t adalah:

P(survival to T) = E[exp(-integral from t to T of lambda(s) ds)]

Formulasi ini secara matematis analog dengan penetapan harga obligasi zero-coupon dalam model suku bunga short-rate. Bahkan, Duffie and Singleton (1999) menunjukkan bahwa obligasi yang dapat mengalami gagal bayar dapat dihargai persis seperti obligasi bebas risiko dengan tingkat diskonto yang dimodifikasi yang mencakup intensitas gagal bayar dan loss given default. Ini menghasilkan solusi bentuk-tertutup yang praktis di bawah spesifikasi affine dari proses hazard.

Keunggulan praktis dibandingkan model struktural cukup signifikan. Pertama, model bentuk-tereduksi dapat dikalibrasi langsung ke spread kredit yang dapat diamati menggunakan teknik yield-curve stripping yang sederhana, tanpa perlu menyimpulkan nilai aset perusahaan yang tidak dapat diamati. Kedua, model ini menangani struktur jangka waktu probabilitas gagal bayar yang kompleks secara alami. Ketiga, model ini dapat diperluas untuk mengakomodasi gagal bayar berkorelasi dan penetapan harga derivatif kredit dalam kerangka matematis yang sama.

Konsekuensinya adalah hilangnya konten ekonomi. Hazard rate lambda(t) adalah objek statistik yang menjelaskan kapan gagal bayar terjadi; ia tidak menjelaskan mengapa gagal bayar terjadi atau variabel tingkat perusahaan apa yang mendorongnya. Untuk tujuan pemantauan risiko, di mana praktisi ingin memahami sumber risiko kredit dan mendiagnosis deteriorasi sejak dini, pendekatan bentuk-tereduksi cenderung menawarkan daya cengkeram yang lebih rendah dibandingkan alternatif struktural.

Z-Score Altman: Klasifikasi Proto-ML

Sebelum machine learning modern, ada Z-score. Altman (1968) menggunakan analisis diskriminan berganda untuk membangun fungsi linear dari lima rasio keuangan yang memisahkan perusahaan bangkrut dari perusahaan yang tidak bangkrut:

Z = 1.2 X1 + 1.4 X2 + 3.3 X3 + 0.6 X4 + 1.0 X5

di mana X1 adalah modal kerja / total aset, X2 adalah laba ditahan / total aset, X3 adalah EBIT / total aset, X4 adalah nilai pasar ekuitas / nilai buku total liabilitas, dan X5 adalah penjualan / total aset.

Perusahaan dengan Z di atas 2.99 diklasifikasikan sebagai aman; perusahaan di bawah 1.81 diklasifikasikan berada dalam zona distres. Zona abu-abu di antaranya bersifat ambigu. Sampel asli Altman mencapai akurasi klasifikasi sekitar 95 persen satu tahun sebelum kebangkrutan.

Dilihat dari perspektif machine learning modern, Z-score adalah klasifikasi linear yang dilatih pada dataset berlabel kecil menggunakan analisis diskriminan. Set fiturnya masuk akal: ia menangkap likuiditas (X1), profitabilitas (X2, X3), leverage (X4), dan efisiensi aset (X5). Keterbatasannya juga jelas: ia bersifat linear, hanya menggunakan lima fitur, memerlukan rekalibrasi lintas periode waktu dan industri, dan dirancang untuk perusahaan manufaktur di era makroekonomi yang berbeda.

Z-score tetap dikutip secara luas dan digunakan sebagai acuan, bukan karena ia merupakan yang tercanggih, tetapi karena interpretabilitasnya menjadikannya berguna untuk pelaporan regulasi, pemantauan covenant, dan penyaringan portofolio di mana auditabilitas menjadi hal yang penting.

Machine Learning: Apa yang Ditambahkan Gradient Boosting

Peralihan ke gradient-boosted decision tree, khususnya XGBoost dan LightGBM, membawa tiga perbaikan nyata dibandingkan model diskriminan klasik dan regresi logistik.

Pertama, nonlinearitas. Rasio keuangan berinteraksi dengan cara yang kompleks; perusahaan dengan leverage tinggi berbahaya di lingkungan suku bunga tinggi tetapi dapat dikelola ketika suku bunga rendah. Model berbasis pohon menangkap interaksi ini tanpa mengharuskan analis untuk menentukannya terlebih dahulu.

Kedua, kekayaan fitur. Model kredit ML modern memproses data akuntansi, data pasar (harga ekuitas, volatilitas ekuitas, spread kredit), indikator makroekonomi, indikator industri, dan dalam beberapa implementasi, fitur tekstual dari earnings call dan laporan. Model Merton menggunakan dua input; model gradient boosting modern dapat menggunakan 200 atau lebih.

Ketiga, penanganan data yang hilang dan tidak seimbang. Gagal bayar korporasi merupakan peristiwa langka. Implementasi gradient boosting menangani ketidakseimbangan kelas secara native melalui pembobotan sampel dan fungsi kerugian yang sensitif terhadap biaya, yang sangat penting untuk klasifikasi kredit di mana false negative (gagal bayar yang terlewat) jauh lebih mahal daripada false positive.

Keuntungan empirisnya nyata. Di berbagai studi dan dataset kredit, gradient boosting secara konsisten mengungguli regresi logistik dan model diskriminan gaya Altman pada metrik prediksi gagal bayar out-of-sample seperti area under the ROC curve (AUC) dan statistik Kolmogorov-Smirnov (KS). Marginnya tidak kecil: perbaikan tipikal sebesar 5 hingga 10 poin AUC dibandingkan regresi logistik umum terjadi pada dataset dengan fitur pasar yang kaya.

Biayanya adalah interpretabilitas. Model gradient boosting dengan 500 pohon dan ratusan fitur tidak dapat diaudit dengan cara yang sama seperti Z-score. Ukuran kepentingan fitur (kepentingan Gini, nilai SHAP) memberikan perkiraan penjelasan, tetapi bukan merupakan interpretasi ekonomi struktural.

Model Neural Hazard

Perbatasan metodologis terbaru menerapkan jaringan saraf pada kerangka pemodelan hazard, menggabungkan struktur matematis model bentuk-tereduksi dengan kekuatan representasional deep learning.

Kvamme et al. (2019) dan karya terkait merumuskan ulang model hazard waktu-diskrit menggunakan arsitektur jaringan saraf. Alih-alih menentukan bentuk parametrik untuk fungsi hazard, jaringan mempelajari pemetaan dari kovariat ke probabilitas gagal bayar kondisional pada setiap langkah waktu. Ini memungkinkan model menangkap efek nonlinear dari variabel tingkat perusahaan dan makro pada hazard rate tanpa asumsi bentuk fungsional yang restriktif dari model intensitas affine.

Gunnarsson et al. (2021) menerapkan kerangka serupa secara khusus pada risiko kredit korporasi dan menemukan bahwa model neural hazard mengungguli regresi logistik dan gradient boosting pada prediksi gagal bayar horizon yang lebih panjang, di mana dinamika temporal hazard rate paling berpengaruh. Keunggulan ini sangat terlihat untuk perusahaan pada tahap awal tekanan keuangan, di mana jalur waktu tekanan covenant dan pembakaran kas bersifat informatif dengan cara yang terlewatkan oleh snapshot cross-sectional.

Arsitektur recurrent (LSTM, GRU) menangani struktur temporal secara langsung. Alih-alih memasukkan snapshot satu periode rasio keuangan ke dalam model, jaringan recurrent memproses deret waktu laporan keuangan dan harga pasar, mempelajari trajektori mana yang mendahului gagal bayar. Ini lebih mendekati apa yang dilakukan analis kredit berpengalaman secara informal: mereka tidak hanya melihat laporan terbaru; mereka melihat trennya.

Konsekuensinya adalah kebutuhan data yang besar. Model neural memerlukan sampel pelatihan yang jauh lebih besar dibandingkan gradient boosting untuk menghindari overfitting, dan dataset gagal bayar korporasi secara inheren terbatas oleh kelangkaan gagal bayar. Regularisasi (dropout, penalti L2), transfer learning lintas sektor, dan augmentasi data membantu, tetapi masalah ini tidak sepenuhnya hilang.

Kerangka Praktisi: Apa yang Digunakan di Mana

Kerangka	Interpretabilitas	Kebutuhan Data	Prediksi Gagal Bayar	Penerimaan Regulasi
Merton / KMV	Tinggi	Pasar + neraca	Sedang	Tinggi
Reduced-form	Sedang	Spread kredit	Tinggi (untuk penetapan harga)	Tinggi
Altman Z-score	Sangat Tinggi	Hanya akuntansi	Sedang	Sangat Tinggi
Gradient Boosting	Rendah-Sedang	Akuntansi + pasar	Tinggi	Sedang
Neural Hazard	Rendah	Data panel besar	Tertinggi	Rendah

Penilaian kredit investment-grade di bank dan manajer aset besar biasanya mengandalkan model struktural (estimasi EDF gaya KMV) yang dicampur dengan overlay berdasarkan penilaian. Model struktural menyediakan jangkar yang berakar secara ekonomi; analis melakukan penyesuaian untuk faktor-faktor yang tidak dapat dilihat model, seperti kualitas manajemen, risiko litigasi, dan posisi strategis.

Desk high-yield dan leveraged loan semakin banyak menggunakan model gradient boosting di samping analisis fundamental tradisional. Model mengidentifikasi outlier yang memerlukan perhatian lebih dekat; analis memutuskan apakah kekhawatiran model mencerminkan deteriorasi yang sesungguhnya atau artefak data.

Praktisi utang distressed dan situasi khusus kredit biasanya paling mengandalkan analisis fundamental bottom-up dan output model struktural. Pada atau mendekati gagal bayar, model bentuk-tereduksi kehilangan keunggulannya karena waktu gagal bayar bukan lagi abstraksi statistik; ia merupakan hasil negosiasi antara kreditur, manajemen, dan regulator.

Hedge fund kredit kuantitatif dan pemberi pinjaman fintech merupakan pengadopsi utama model neural hazard. Mereka memiliki volume data dan infrastruktur teknis untuk mendukung model-model ini, dan mereka menghadapi lebih sedikit batasan regulasi pada bentuk model dibandingkan bank yang diregulasi.

Apa yang Hilang dari Setiap Model

Memahami apa yang dikorbankan setiap model sama pentingnya dengan memahami apa yang diperolehnya. Model Merton memaksakan struktur ekonomi tertentu; ketika struktur tersebut salah (dan sering kali memang salah, terutama untuk perusahaan dengan struktur modal yang kompleks), model gagal secara sistematis, bukan secara acak. Model bentuk-tereduksi cocok dengan harga pasar tetapi diam tentang mekanisme gagal bayar; mereka tidak dapat memperingatkan tentang fundamental yang memburuk sebelum harga pasar bergerak. Gradient boosting memiliki kekuatan besar tetapi bersifat non-kausal; ia mengorelasikan pola dalam data pelatihan dengan gagal bayar, dan korelasi tersebut dapat rusak secara out-of-sample ketika rezim ekonomi berubah. Model neural memperluas kemampuan ini secara temporal tetapi memperparah persyaratan interpretabilitas dan data.

Tidak satu pun dari kerangka ini yang salah. Masing-masing merupakan aproksimasi yang berbeda terhadap realitas ekonomi kompleks yang sama.

Keterbatasan

Model kredit dari setiap jenis memiliki keterbatasan umum yang sama. Dataset gagal bayar berukuran kecil relatif terhadap kompleksitas model yang berusaha mereka dukung; bahkan dengan data selama berdekade-dekade, gagal bayar investment-grade cukup langka sehingga validasi out-of-sample menjadi tidak dapat diandalkan. Model yang dilatih dalam satu siklus kredit dapat menghasilkan prediksi yang secara sistematis bias di siklus berikutnya. Interaksi antara risiko kredit dan risiko sistemik (kecenderungan gagal bayar untuk mengelompok selama resesi) sulit dimodelkan tanpa komponen makro, dan sebagian besar model kredit memperlakukan lingkungan makro sebagai kovariat, bukan sebagai keadaan yang turut berevolusi.

Persyaratan regulasi memberlakukan batasan tersendiri. Bank yang tunduk pada Basel III/IV harus menggunakan model yang memenuhi standar interpretabilitas dan auditabilitas. Ini secara efektif mengeliminasi jaringan saraf dalam untuk perhitungan modal regulasi, bahkan ketika jaringan tersebut menunjukkan kinerja out-of-sample yang superior. Garis depan akademis dan garis depan regulasi tidak selalu berada di tempat yang sama.

Terkait

Analisis Sentimen NLP untuk Trading Kuantitatif: Dari Kamus hingga Transformer

Riset Orisinal QD12 min

Keutamaan Kompleksitas: Mengapa Model Overparameterized Memprediksi Return Lebih Baik

Model & Kerangka Kerja12 min

Machine Learning dalam Penetapan Harga Aset: Apa yang Benar-Benar Berhasil

Model & Kerangka Kerja14 min

Dinamika Kurva Imbal Hasil: Dari Nelson-Siegel ke Struktur Jangka Modern

Model & Kerangka Kerja16 min

Analisis ini disintesis dari Quant Decoded Research oleh QD Research Engine AI-Synthesised — platform riset otomatis Quant Decoded — dan ditinjau oleh tim editorial kami untuk memastikan akurasi. Pelajari lebih lanjut tentang metodologi kami.

Referensi

Merton, R.C. (1974). "On the Pricing of Corporate Debt: The Risk Structure of Interest Rates." Journal of Finance, 29(2), 449-470. https://doi.org/10.1111/j.1540-6261.1974.tb03058.x
Altman, E.I. (1968). "Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy." Journal of Finance, 23(4), 589-609. https://doi.org/10.1111/j.1540-6261.1968.tb00843.x
Jarrow, R.A. & Turnbull, S.M. (1995). "Pricing Derivatives on Financial Securities Subject to Credit Risk." Journal of Finance, 50(1), 53-85. https://doi.org/10.1111/j.1540-6261.1995.tb05167.x
Duffie, D. & Singleton, K.J. (1999). "Modeling Term Structures of Defaultable Bonds." Review of Financial Studies, 12(4), 687-720. https://doi.org/10.1093/rfs/12.4.687
Eom, Y.H., Helwege, J. & Huang, J. (2004). "Structural Models of Corporate Bond Pricing: An Empirical Analysis." Review of Financial Studies, 17(2), 499-544. https://doi.org/10.1093/rfs/hhg053
Kvamme, H., Foss, N., Borgan, O. & Scheel, I. (2019). "Time-to-event prediction with neural networks and Cox regression." KDD 2019. https://doi.org/10.1145/3292500.3330687
Gunnarsson, B.R., Vanden Broucke, S., Baesens, B., Óskarsdóttir, M. & Lemahieu, W. (2021). "Deep learning for credit scoring: Do or don't?" Expert Systems with Applications, 177, 114722. https://doi.org/10.1016/j.eswa.2021.114722