核心要點

GARCH(1,1)在問世四十年後仍然是波動率預測的核心模型,僅用三個參數就能捕捉90%以上的條件變異數動態。雖然EGARCH和GJR-GARCH等非對稱擴展模型通過對槓桿效應建模來改善市場壓力期間的表現,但Hansen和Lunde(2005)在對330個GARCH變體的比較中發現,沒有模型能在日匯率波動率預測方面一致優於經過良好估計的GARCH(1,1)。實務教訓非常明確:模型的簡約性在樣本外預測中往往勝過模型的複雜性。
從固定波動率到條件波動率
在Robert Engle於1982年發表其開創性論文之前,金融計量經濟學將波動率視為常數。投資組合最適化使用從全樣本推導的單一變異數估計值,風險度量假設穩定分布,選擇權在波動率為已知固定參數的假設下定價。任何觀察市場超過幾個月的人都知道這是錯誤的。波動率具有聚集性:平靜期持續存在,動盪期也持續存在。1987年10月大崩盤、1997年亞洲金融危機和2008年全球金融危機都表現出固定變異數模型無法捕捉的劇烈波動率聚集。
Engle(1982)用自迴歸條件異變異數(ARCH)模型將這一觀察正式化。ARCH模型不將變異數視為固定值,而是允許時點t的條件變異數依賴於過去的報酬衝擊平方。最簡單的ARCH(1)規格如下:
h(t) = omega + alpha * epsilon(t-1)^2
其中h(t)是條件變異數,omega是基準變異數水準,epsilon(t-1)是前一期的報酬衝擊,alpha決定昨日的衝擊對今日變異數估計的影響程度。當alpha較大時,大的報酬衝擊(正或負)會導致下一期估計變異數大幅增加。當alpha較小時,模型接近於固定變異數。
ARCH模型為Engle贏得了2003年諾貝爾經濟學獎的共同授予。但原始公式有一個實務限制:要捕捉波動率聚集的緩慢衰減,需要許多滯後報酬衝擊平方(高階ARCH),這需要估計許多參數,且經常產生不穩定的估計值。
GARCH(1,1)的突破
Bollerslev(1986)用廣義ARCH模型(即GARCH)解決了這個簡約性問題。核心洞見是將滯後條件變異數本身作為預測變數納入:
h(t) = omega + alpha * epsilon(t-1)^2 + beta * h(t-1)
這個單一方程GARCH(1,1)同時捕捉報酬衝擊的即時影響(通過alpha)和過去波動率的持續性(通過beta)。參數beta作為對報酬衝擊平方全部歷史的指數平滑權重,僅用三個參數就能生成長期持續的波動率聚集。
alpha + beta之和是持續性參數。當這個和接近1時,波動率衝擊消散緩慢,無條件變異數omega / (1 - alpha - beta)較大。當和恰好等於1時,過程為積分GARCH(IGARCH),意味著波動率衝擊永遠不會完全消散。日頻股票報酬的實證估計通常得到alpha + beta在0.97到0.995之間,表明非常高的持續性。
下表顯示了使用日報酬率的主要資產類別的典型GARCH(1,1)參數估計值:
| 資產 | omega | alpha | beta | alpha + beta | 半衰期(天) |
|---|---|---|---|---|---|
| S&P 500 | 0.000002 | 0.09 | 0.90 | 0.99 | 69 |
| EUR/USD | 0.000001 | 0.04 | 0.95 | 0.99 | 69 |
| 10Y UST | 0.000003 | 0.05 | 0.93 | 0.98 | 34 |
| 黃金 | 0.000004 | 0.07 | 0.91 | 0.98 | 34 |
| 原油 | 0.000008 | 0.08 | 0.90 | 0.98 | 34 |
| 比特幣 | 0.000025 | 0.12 | 0.85 | 0.97 | 23 |
半衰期列顯示波動率衝擊衰減到初始影響一半所需的天數,計算公式為ln(0.5) / ln(alpha + beta)。持續性越高,衝擊反響越久,這對風險管理期限和選擇權定價至關重要。
槓桿效應:下跌為何放大波動率
GARCH(1,1)遺漏的一個現象是波動率對正報酬和負報酬響應的不對稱性。實證上,負報酬衝擊比同等幅度的正衝擊更大程度地增加後續波動率。這就是槓桿效應,最早由Black(1976)記錄,他假設股價下跌會增加企業的槓桿比率,從而使股票更具波動性。
兩個主要擴展模型處理了這種不對稱性。
Nelson(1991)提出了指數GARCH(EGARCH)模型,該模型對變異數的對數而非變異數本身建模:
ln h(t) = omega + alpha * [|z(t-1)| - E|z(t-1)|] + gamma * z(t-1) + beta * ln h(t-1)
其中z(t-1)是標準化殘差。參數gamma捕捉不對稱性:當gamma為負時,負衝擊比正衝擊更大幅度地增加波動率。由於模型在對數尺度上運行,它自動確保條件變異數始終為正,無需參數約束。
Glosten、Jagannathan和Runkle(1993)提出了GJR-GARCH模型,添加了一個指示函數:
h(t) = omega + (alpha + gamma * I(t-1)) * epsilon(t-1)^2 + beta * h(t-1)
其中I(t-1)在epsilon(t-1)為負時等於1,否則等於0。參數gamma捕捉負衝擊的額外波動率影響。對於S&P 500,典型估計給出gamma約0.10到0.15,這意味著-2%的報酬比+2%的報酬使次日條件變異數的增幅約大50-75%。
下表比較了這些規格對S&P 500日報酬率(1990-2024)的模型適合度:
| 模型 | 參數數 | 對數似然 | AIC | BIC | 槓桿捕捉 |
|---|---|---|---|---|---|
| GARCH(1,1) | 3 | -9842 | 19690 | 19712 | 否 |
| EGARCH(1,1) | 4 | -9798 | 19604 | 19633 | 是 |
| GJR-GARCH(1,1) | 4 | -9801 | 19610 | 19639 | 是 |
| GARCH(2,1) | 4 | -9840 | 19688 | 19717 | 否 |
| TGARCH(1,1) | 4 | -9803 | 19614 | 19643 | 是 |
非對稱模型(EGARCH、GJR-GARCH、TGARCH)在資訊準則方面一致優於對稱GARCH。添加第二個GARCH滯後(GARCH(2,1))幾乎沒有改善,這確認了槓桿效應比額外滯後更重要。
實務中的參數估計
GARCH參數通常通過最大似然法估計。在標準化殘差服從常態分布的假設下,T個觀測值樣本的對數似然函數為:
L = -0.5 * sum[ln(h(t)) + epsilon(t)^2 / h(t)]
在實務中,金融報酬表現出比常態分布更厚的尾部,因此通常使用Student-t分布或廣義誤差分布(GED)。誤差分布的選擇影響估計參數和尾部風險預測的品質。
穩健估計的幾個實務考慮因素很重要。樣本量應至少為1,000個日觀測值(約四年),以獲得穩定的參數估計值。最適化程式應在可用時使用解析梯度,結果應針對多個起始值進行檢驗以避免局部最適。標準誤差應使用Bollerslev和Wooldridge(1992)的穩健(三明治)估計量計算,即使誤差分布設定錯誤也保持有效。
一個常見陷阱是在不考慮結構性斷裂的情況下解釋非常高的beta估計值(0.95以上)。如果樣本跨越包含根本性制度變化(如從高通膨向低通膨的轉型)的時期,GARCH模型會將由此產生的變異數偏移歸因於極端持續性,從而高估beta並降低模型的預測準確度。
預測準確度:實務中什麼有效
Hansen和Lunde(2005)進行了GARCH類模型最全面的比較,評估了330種不同規格用於預測IBM股票報酬和DM/USD匯率報酬的日波動率。他們的發現出人意料地明確:
對於匯率數據,沒有模型顯著優於GARCH(1,1)。對於股票數據,非對稱模型(EGARCH、GJR-GARCH)相對於對稱GARCH提供了統計上顯著的改善。槓桿效應在股票市場比在外匯市場更為突出,因為負報酬與波動率的相關性更強。
下表總結了以GARCH(1,1)為基準的均方誤差(MSE)衡量的樣本外預測準確度(歸一化為1.00):
| 模型 | S&P 500 MSE | EUR/USD MSE | 10Y UST MSE |
|---|---|---|---|
| GARCH(1,1) | 1.00 | 1.00 | 1.00 |
| EGARCH(1,1) | 0.93 | 0.99 | 0.97 |
| GJR-GARCH(1,1) | 0.94 | 1.00 | 0.98 |
| GARCH(2,2) | 1.01 | 1.00 | 1.01 |
| Component GARCH | 0.96 | 0.98 | 0.96 |
低於1.00的值表示預測準確度優於GARCH(1,1)。模式是一致的:非對稱模型將股票波動率預測改善6-7%,對債券提供邊際改善,對外匯幾乎沒有影響。更複雜的對稱模型很少有幫助。
在風險管理和選擇權定價中的應用
GARCH模型在現代金融中發揮兩個主要實務功能。
在風險管理中,基於GARCH的風險值(VaR)和預期損失(ES)計算將風險估計條件化於當前波動率狀態。在平靜期,基於GARCH的VaR收緊,允許在同一風險預算內建立更大的部位。在動盪期,它擴大,自動縮減部位規模。這種條件方法比無條件方法產生更準確的風險預測,特別是在Basel III等監管框架使用的1天和10天期限上。
在選擇權定價中,GARCH模型彌合了離散時間計量經濟建模和連續時間選擇權估值之間的差距。Duan(1995)開發了局部風險中性估值關係(LRNVR),使得從歷史報酬估計的GARCH參數可用於風險中性測度下的選擇權定價。核心洞見是GARCH捕捉的波動率持續性轉化為隱含波動率的期限結構:高持續性(alpha + beta接近1)產生更平坦的期限結構,而較低的持續性產生更陡峭的期限結構。非對稱GARCH模型額外生成隱含波動率偏斜,捕捉市場傾向於更重地為下行風險定價的特徵。
侷限性和現代替代方法
GARCH模型在單一頻率上運行,通常為日頻。不經過聚合就無法利用日內數據的資訊內容,而聚合會丟棄可能有價值的高頻訊號。由日內報酬構建的實現波動率度量提供更準確的日變異數估計,並可作為同時在多個期限上預測的HAR(異質自迴歸)模型的輸入。
GARCH模型假設條件變異數方程的參數化結構,這可能無法足夠快地適應央行政策轉換或地緣政治衝擊等突然的制度變化。制度轉換GARCH模型通過在不同市場狀態下允許不同的參數集來解決這一問題,代價是額外的參數和估計複雜性。
包括LSTM神經網路和基於樹的模型在內的機器學習方法通過捕捉GARCH線性變異數方程遺漏的非線性模式,在波動率預測方面展現了前景。然而,這些模型需要大量更多的數據,容易過擬合,且缺乏使GARCH模型在監管報告和風險溝通中有用的可解釋性。
儘管存在這些侷限性,GARCH仍然是標準,原因有幾個:計算速度快、有理論基礎、易於解釋、且有數十年的實證證據充分支持。對於風險管理和衍生性商品定價的大多數實務應用,經過良好估計的GARCH(1,1)或GJR-GARCH(1,1)仍然是合適的起點。
可執行的結論
GARCH模型族將波動率從固定參數轉變為動態的、可預測的量。對於從業者,證據支持明確的層級:以GARCH(1,1)為起點獲得簡約性和穩健性,在建模槓桿效應重要的股票波動率時升級到GJR-GARCH或EGARCH,避免增加複雜性(更高階、異域分布或制度轉換)的誘惑,除非有強有力的樣本外證據表明額外參數改善了預測。alpha + beta之和是最重要的單一診斷指標;高於0.98的值表示高持續性並暗示波動率制度轉換將緩慢,而低於0.95的值表示更快的均值回歸和更短的預測期限。
Written by James Chen · Reviewed by Sam
本文基於引用的一手文獻,並經編輯團隊審核以確保準確性和歸屬。 了解我們的方法論.
參考文獻
-
Engle, R. F. (1982). "Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation." Econometrica, 50(4), 987-1007. https://doi.org/10.2307/1912773
-
Bollerslev, T. (1986). "Generalized Autoregressive Conditional Heteroskedasticity." Journal of Econometrics, 31(3), 307-327. https://doi.org/10.1016/0304-4076(86)90063-1
-
Nelson, D. B. (1991). "Conditional Heteroskedasticity in Asset Returns: A New Approach." Econometrica, 59(2), 347-370. https://doi.org/10.2307/2938260
-
Glosten, L. R., Jagannathan, R., & Runkle, D. E. (1993). "On the Relation between the Expected Value and the Volatility of the Nominal Excess Return on Stocks." Journal of Finance, 48(5), 1779-1801. https://doi.org/10.1111/j.1540-6261.1993.tb05128.x
-
Hansen, P. R., & Lunde, A. (2005). "A Forecast Comparison of Volatility Models: Does Anything Beat a GARCH(1,1)?" Journal of Applied Econometrics, 20(7), 873-889. https://doi.org/10.1002/jae.800
-
Duan, J.-C. (1995). "The GARCH Option Pricing Model." Mathematical Finance, 5(1), 13-32. https://doi.org/10.1111/j.1540-6261.1995.tb05185.x
-
Bollerslev, T., & Wooldridge, J. M. (1992). "Quasi-Maximum Likelihood Estimation and Inference in Dynamic Models with Time-Varying Covariances." Econometric Reviews, 11(2), 143-172. https://doi.org/10.2307/2951764
-
Black, F. (1976). "Studies of Stock Price Volatility Changes." Proceedings of the 1976 Meetings of the American Statistical Association, Business and Economics Statistics Section, 177-181.