Poin Utama

Kointegrasi adalah fondasi matematis yang memisahkan pairs trading yang ketat dari pendekatan berbasis korelasi yang naif. Dua harga saham dapat memiliki korelasi nol selama suatu periode namun tetap terkointegrasi, artinya kombinasi liniernya kembali ke mean yang stabil. Metode dua langkah Engle-Granger dan uji Johansen menyediakan alat statistik formal untuk mengidentifikasi hubungan keseimbangan jangka panjang ini. Setelah pasangan terkointegrasi ditemukan, model error correction mengatur perilaku spread, dan half-life mean reversion menentukan seberapa cepat peluang trading terselesaikan. Strategi pairs trading yang dibangun atas kointegrasi memiliki keunggulan struktural dibandingkan metode berbasis jarak karena menguji hubungan ekonomi yang sesungguhnya, bukan mengandalkan kedekatan harga historis.
Wanita Mabuk dan Anjingnya
Bayangkan seorang wanita meninggalkan bar larut malam dengan anjingnya yang ditali. Keduanya berjalan agak acak; wanita itu terhuyung-huyung di jalur yang tidak bisa diprediksi, dan anjingnya berlari ke sana-sini mengejar bau. Secara individu, tak satu pun mengikuti lintasan yang bisa diprediksi. Namun tali mengikat jarak maksimum di antara mereka. Tidak peduli seberapa tak beraturan masing-masing bergerak, jarak di antara mereka tetap terbatas dan cenderung kembali ke panjang tali.
Inilah kointegrasi dalam satu gambaran. Wanita dan anjing masing-masing adalah proses non-stasioner (seri I(1) dalam bahasa ekonometrika time series), artinya posisi mereka secara individual mengikuti random walk. Namun selisih posisi mereka adalah stasioner (I(0)), artinya berfluktuasi di sekitar mean yang stabil dan kembali ketika menyimpang terlalu jauh.
Analogi ini sering diatribusikan kepada Murray (1994), menangkap perbedaan halus yang banyak trader lewatkan. Korelasi mengukur bagaimana dua seri bergerak bersama dalam interval pendek. Kointegrasi mengukur apakah hubungan keseimbangan jangka panjang ada di antara mereka. Dua saham bisa memiliki korelasi tinggi tanpa kointegrasi (bergerak bersama sehari-hari tetapi menyimpang secara permanen seiring waktu). Sebaliknya, dua saham bisa memiliki korelasi jangka pendek rendah tetapi kointegrasi kuat (mengikuti jalur jangka pendek berbeda tetapi kombinasi linier harga mereka selalu kembali ke keseimbangan).
Stasioneritas dan Orde Integrasi
Sebelum menguji kointegrasi, perlu memahami konsep orde integrasi. Sebuah time series adalah terintegrasi orde d, ditulis I(d), jika memerlukan d putaran differencing untuk menjadi stasioner.
Kebanyakan harga saham individual adalah I(1). Dalam level, mereka mengikuti random walk dengan drift. Namun first difference mereka (return harian) kira-kira stasioner, berfluktuasi di sekitar mean dengan varians konstan. Anda tidak bisa secara menguntungkan memperdagangkan seri I(1) tunggal dengan asumsi bahwa ia akan kembali ke level tertentu, karena ia tidak memiliki level tetap untuk dikembalikan.
Kointegrasi menawarkan jalan keluar dari masalah ini. Jika dua seri I(1) X dan Y dapat dikombinasikan sebagai Z = Y - beta * X, dan seri yang dihasilkan Z adalah I(0), maka X dan Y terkointegrasi dengan vektor kointegrasi (1, -beta). Spread Z adalah kuantitas yang bisa diperdagangkan: ia memiliki mean tetap, dan deviasi dari mean tersebut bersifat sementara.
Uji Augmented Dickey-Fuller (ADF) adalah alat standar untuk menguji apakah suatu seri stasioner. Ia menguji hipotesis nol bahwa seri memiliki unit root (adalah I(1)) terhadap alternatif bahwa ia stasioner (adalah I(0)). Regresi uji adalah:
Delta_Z(t) = alpha + gamma * Z(t-1) + jumlah lag Delta_Z + epsilon(t)
Jika gamma secara signifikan negatif (statistik uji jatuh di bawah nilai kritis), kita menolak null unit root dan menyimpulkan seri tersebut stasioner. Nilai kritis untuk residual kointegrasi berbeda dari tabel ADF standar karena residual dihasilkan dari regresi yang diestimasi, bukan diamati langsung.
Metode Dua Langkah Engle-Granger
Engle and Granger (1987), makalah yang menghasilkan Nobel Ekonomi 2003 untuk Robert Engle dan Clive Granger, memformalisasi konsep kointegrasi dan memperkenalkan prosedur pengujian dua langkah yang praktis.
Langkah satu: estimasi regresi kointegrasi. Jalankan regresi ordinary least squares (OLS) dari satu variabel I(1) terhadap yang lain:
Y(t) = alpha + beta * X(t) + epsilon(t)
Residual dari regresi ini mewakili spread: deviasi Y dari hubungan keseimbangan jangka panjang yang diestimasi dengan X. Jika Y dan X terkointegrasi, residual ini seharusnya stasioner.
Langkah dua: uji stasioneritas residual. Terapkan uji ADF pada residual yang diestimasi. Jika uji menolak null unit root, bukti mendukung kointegrasi antara Y dan X. Nilai kritis untuk uji ini lebih ketat dari nilai kritis ADF standar, sebagaimana ditabulasi oleh MacKinnon (1991), karena residual diestimasi bukan diamati.
Metode Engle-Granger intuitif dan mudah diimplementasikan, itulah mengapa ia tetap menjadi titik awal paling umum untuk riset pairs trading. Namun ia memiliki keterbatasan penting. Ia hanya dapat mendeteksi satu hubungan kointegrasi antara dua variabel. Ia mengharuskan peneliti memilih variabel mana yang menjadi variabel dependen (menukar Y dan X bisa mengubah kesimpulan). Dan estimator OLS langkah pertama mungkin berkinerja buruk dalam sampel kecil.
Uji Johansen: Alternatif yang Lebih Kuat
Johansen (1988) mengembangkan pendekatan maximum likelihood yang mengatasi keterbatasan metode Engle-Granger. Uji Johansen bekerja dalam kerangka vector autoregressive (VAR) dan dapat secara simultan menguji beberapa hubungan kointegrasi di antara beberapa variabel.
Output utama uji Johansen adalah jumlah vektor kointegrasi (rank kointegrasi) di antara serangkaian variabel. Untuk aplikasi pairs trading dengan dua saham, uji menentukan apakah nol atau satu hubungan kointegrasi ada. Trace statistic dan maximum eigenvalue statistic menyediakan dua statistik uji alternatif; keduanya menguji hipotesis nol paling banyak r hubungan kointegrasi terhadap alternatif lebih banyak.
Pendekatan Johansen menawarkan beberapa keunggulan bagi praktisi. Tidak perlu memilih variabel dependen. Menangani beberapa time series secara simultan, memungkinkan trader mencari basket terkointegrasi (tiga saham atau lebih yang berbagi keseimbangan). Dan menyediakan estimasi maximum likelihood dari vektor kointegrasi, yang secara asimptotik lebih efisien dari estimasi OLS Engle-Granger.
Untuk sistem bivariat dengan saham A dan B, rank Johansen 1 mengkonfirmasi kointegrasi dan menyediakan vektor kointegrasi yang diestimasi secara langsung. Rank 0 berarti tidak ada kointegrasi, dan pasangan tersebut tidak boleh diperdagangkan sebagai spread mean-reverting.
Model Error Correction
Setelah kointegrasi terbentuk, model error correction (ECM) mendeskripsikan bagaimana sistem menyesuaikan kembali menuju keseimbangan ketika spread menyimpang. ECM, diturunkan langsung dari Granger representation theorem dalam Engle and Granger (1987), berbentuk:
Delta_Y(t) = alpha_Y + lambda_Y * Z(t-1) + lag terms + epsilon_Y(t)
Delta_X(t) = alpha_X + lambda_X * Z(t-1) + lag terms + epsilon_X(t)
Di sini Z(t-1) adalah lagged spread (error correction term), dan koefisien lambda mengukur kecepatan penyesuaian setiap saham menuju keseimbangan. Jika lambda_Y negatif dan signifikan, berarti Y bergerak kembali ke keseimbangan ketika spread positif (Y di atas keseimbangan). Jika lambda_X positif dan signifikan, X bergerak ke arah sebaliknya.
ECM bernilai bagi pairs trader karena mengungkap saham mana yang melakukan penyesuaian. Dalam banyak pasangan riil, satu saham menyesuaikan lebih cepat dari yang lain. Trader dapat mengeksploitasi asimetri ini dengan menempatkan posisi lebih besar pada saham yang menyesuaikan lebih cepat, atau menggunakan ECM untuk memperkirakan arah spread selama beberapa periode ke depan.
Half-Life Mean Reversion
Kecepatan spread terkointegrasi kembali ke mean-nya menentukan apakah pairs trade secara praktis layak. Spread yang memerlukan dua tahun untuk kembali secara statistik menarik tetapi secara operasional tidak berguna; spread yang kembali dalam lima hingga lima belas hari trading dapat ditindaklanjuti.
Half-life diturunkan dari proses Ornstein-Uhlenbeck (OU), analog waktu kontinu dari proses diskrit AR(1) yang digunakan untuk memodelkan spread. Jika spread Z mengikuti:
Z(t) = phi * Z(t-1) + epsilon(t)
di mana phi adalah koefisien autoregresif (0 < phi < 1 untuk proses stasioner), maka half-life adalah:
t_half = -ln(2) / ln(phi)
Formula ini memberikan jumlah periode yang diharapkan untuk deviasi dari mean meluruh setengahnya. Phi sebesar 0,95 mengimplikasikan half-life sekitar 13,5 hari trading. Phi sebesar 0,99 mengimplikasikan half-life sekitar 69 hari trading.
Untuk pairs trading praktis, half-life antara 5 dan 60 hari trading cenderung bekerja paling baik. Di bawah 5 hari, spread kembali terlalu cepat bagi kebanyakan sistem eksekusi untuk ditangkap secara menguntungkan setelah biaya transaksi. Di atas 60 hari, modal terikat terlalu lama dan risiko rusaknya hubungan kointegrasi meningkat.
| Contoh Pasangan | Statistik ADF | p-value | Terkointegrasi? | Half-Life (hari) | Phi |
|---|---|---|---|---|---|
| KO / PEP | -3,42 | 0,011 | Ya | 18,2 | 0,963 |
| XOM / CVX | -3,89 | 0,003 | Ya | 12,7 | 0,947 |
| JPM / BAC | -2,15 | 0,228 | Tidak | 43,1 | 0,984 |
| MSFT / AAPL | -1,87 | 0,347 | Tidak | 61,4 | 0,989 |
| HD / LOW | -3,61 | 0,006 | Ya | 15,3 | 0,956 |
| GLD / GDX | -4,12 | 0,001 | Ya | 8,9 | 0,925 |
Implementasi Praktis: Dari Teori ke Trading
Membangun strategi pairs trading berbasis kointegrasi melibatkan alur kerja sistematis yang langsung dipetakan dari teori di atas.
Tahap pertama adalah identifikasi kandidat. Daripada menguji semua pasangan saham yang mungkin (yang menciptakan masalah perbandingan berganda yang serius), praktisi mempersempit universe menggunakan logika ekonomi. Saham dalam industri yang sama, dengan model bisnis serupa, terpapar input komoditas yang sama, atau tunduk pada kerangka regulasi yang sama lebih mungkin berbagi keseimbangan jangka panjang yang sesungguhnya. Coca-Cola dan PepsiCo, ExxonMobil dan Chevron, Home Depot dan Lowe's adalah contoh klasik. Memulai dari fundamental ekonomi mengurangi risiko bahwa hasil kointegrasi yang signifikan secara statistik adalah artefak palsu dari data mining.
Tahap kedua adalah pengujian kointegrasi selama jendela formasi bergulir, biasanya 12 hingga 24 bulan data harian. Uji Engle-Granger dan Johansen diterapkan, dengan pasangan hanya dipertahankan jika kedua metode mengkonfirmasi kointegrasi pada level signifikansi 5%. Vektor kointegrasi (hedge ratio beta) diestimasi dari jendela ini.
Tahap ketiga adalah konstruksi dan normalisasi spread. Spread Z(t) = Y(t) - beta * X(t) dihitung dan distandardisasi ke z-score menggunakan mean dan standar deviasi periode formasi. Normalisasi ini memungkinkan threshold entry dan exit universal diterapkan di berbagai pasangan.
Tahap keempat adalah generasi sinyal. Pendekatan standar membuka posisi ketika z-score melampaui threshold (biasanya 2,0 standar deviasi) dan menutup ketika kembali ke nol atau melewati threshold stop-loss (biasanya 3,0 hingga 4,0 standar deviasi). Arah ditentukan oleh tanda z-score: z-score positif berarti Y mahal relatif terhadap X, jadi trader short Y dan beli X; z-score negatif memicu trade berlawanan.
| Parameter | Konservatif | Moderat | Agresif |
|---|---|---|---|
| Jendela formasi | 24 bulan | 18 bulan | 12 bulan |
| Threshold entry (sigma) | 2,5 | 2,0 | 1,5 |
| Threshold exit (sigma) | 0,5 | 0,0 | 0,0 |
| Stop-loss (sigma) | 4,0 | 3,5 | 3,0 |
| Periode holding maks | 60 hari | 40 hari | 20 hari |
| Filter half-life | 5-40 hari | 5-50 hari | 5-60 hari |
Bukti Empiris: Apakah Berhasil?
Gatev, Goetzmann, and Rouwenhorst (2006), studi empiris pairs trading yang paling banyak dikutip, mendokumentasikan bahwa strategi pairs trading berbasis jarak sederhana menghasilkan return excess tahunan sekitar 11% selama 1962 hingga 2002 di ekuitas AS. Strategi ini market-neutral dan tidak memerlukan analisis fundamental; murni statistikal.
Namun riset selanjutnya menceritakan kisah yang lebih bernuansa. Do and Faff (2010) memperluas sampel Gatev hingga 2008 dan menemukan bahwa profit telah menurun substansial, dengan sebagian besar keunggulan menghilang setelah memperhitungkan biaya transaksi realistis. Pada 2010-an, pendekatan berbasis jarak sederhana menghasilkan return mendekati nol atau negatif setelah biaya.
Avellaneda and Lee (2010) mengusulkan kerangka yang lebih canggih menggunakan principal component analysis dan proses Ornstein-Uhlenbeck. Pendekatan mereka, yang lebih dekat dengan metodologi kointegrasi yang dijelaskan di sini, mencapai Sharpe ratio di atas 1,0 di ekuitas AS dengan secara sistematis memperdagangkan residual dari model faktor. Insight kunci adalah bahwa memasukkan kecepatan mean-reversion (parameter OU) ke dalam sinyal trading meningkatkan kinerja secara signifikan dibandingkan metode jarak sederhana.
| Studi | Periode | Metode | Return Tahunan | Sharpe Ratio |
|---|---|---|---|---|
| Gatev et al. (2006) | 1962-2002 | Jarak | ~11% | ~0,75 |
| Do & Faff (2010) | 1962-2009 | Jarak | ~4% (menurun) | ~0,35 |
| Avellaneda & Lee (2010) | 1997-2007 | OU / Faktor | ~8-15% | ~1,0-1,5 |
| Krauss (2017) survei | Beragam | Beragam | Tren menurun | Tergantung strategi |
Konsensus akademis jelas: metode berbasis kointegrasi dan yang memperhatikan kecepatan mean-reversion secara signifikan mengungguli metode jarak sederhana, terutama dalam periode yang lebih baru ketika pasar menjadi lebih efisien dan kompetisi di antara trader kuantitatif semakin intensif.
Ketika Kointegrasi Rusak
Kointegrasi adalah hubungan statistik, bukan hukum alam. Ia bisa dan memang rusak. Perubahan struktural dalam model bisnis satu perusahaan, merger atau akuisisi, pergeseran regulasi, atau perubahan permanen dalam dinamika kompetitif dapat menghancurkan keseimbangan yang secara historis bertahan. Ketika tali antara wanita mabuk dan anjingnya putus, spread bisa menyimpang secara permanen, dan pairs trade berbasis mean reversion akan mengakumulasi kerugian tanpa batas.
Inilah mengapa disiplin stop-loss tidak bisa ditawar dalam pairs trading. Ini juga mengapa re-estimasi bergulir dari hubungan kointegrasi sangat penting. Praktisi biasanya mengestimasi ulang hedge ratio dan menguji ulang kointegrasi setiap satu hingga tiga bulan, membuang pasangan yang tidak lagi lolos uji statistik.
Masalah perbandingan berganda adalah jebakan kritis lainnya. Menguji ribuan pasangan dan memilih yang lolos uji kointegrasi pada level 5%, secara kebetulan saja, akan mengidentifikasi banyak hubungan palsu. Koreksi Bonferroni atau filter ekonomi (membatasi pada pasangan satu industri) membantu meringankan masalah ini, tetapi tingkat overfitting tertentu tidak terhindarkan dalam proses seleksi pasangan berbasis data.
Dari Pairs ke Basket: Ekstensi Multivariat
Kerangka Johansen secara alami meluas ke basket tiga atau lebih aset terkointegrasi. Jika tiga saham berbagi dua hubungan kointegrasi, trader dapat mengkonstruksi dua spread mean-reverting independen, berpotensi meningkatkan diversifikasi dan mengurangi risiko rusaknya satu hubungan pasangan.
Avellaneda and Lee (2010) menggunakan eigenportfolio yang diturunkan dari PCA untuk mengkonstruksi basket saham yang stasioner secara konstruksi relatif terhadap faktor sektoral mereka. Pendekatan ini menggeneralisasi pairs trading ke kerangka arbitrase statistik penuh, di mana jumlah sinyal mean-reverting yang bisa diperdagangkan meningkat seiring jumlah eigenportfolio yang signifikan.
Mesin matematisnya sama: pengujian kointegrasi, dinamika error correction, estimasi half-life. Namun konstruksi portofolio menjadi lebih kompleks, memerlukan perhatian cermat terhadap position sizing, persyaratan margin, dan struktur korelasi di antara beberapa spread.
Terkait
Written by Sam · Reviewed by Sam
Artikel ini berdasarkan literatur primer yang dikutip dan telah ditinjau oleh tim editorial kami untuk akurasi dan atribusi. Kebijakan Editorial.
Referensi
- Engle, R. F., & Granger, C. W. J. (1987). Co-Integration and Error Correction: Representation, Estimation, and Testing. Econometrica, 55(2), 251-276. https://doi.org/10.2307/1913236
- Johansen, S. (1988). Statistical analysis of cointegration vectors. Journal of Economic Dynamics and Control, 12(2-3), 231-254. https://doi.org/10.1016/0304-4076(88)90041-3
- Johansen, S. (1991). Estimation and Hypothesis Testing of Cointegration Vectors in Gaussian Vector Autoregressive Models. Econometrica, 59(6), 1551-1580. https://doi.org/10.2307/2938278
- Gatev, E., Goetzmann, W. N., & Rouwenhorst, K. G. (2006). Pairs Trading: Performance of a Relative-Value Arbitrage Rule. Review of Financial Studies, 19(3), 797-827. https://doi.org/10.1093/rfs/hhj020
- Avellaneda, M., & Lee, J.-H. (2010). Statistical arbitrage in the US equities market. Quantitative Finance, 10(7), 761-782. https://doi.org/10.1080/14697680903124632
- Do, B., & Faff, R. (2010). Does simple pairs trading still work? Financial Analysts Journal, 66(4), 83-95. https://doi.org/10.1016/j.jbankfin.2010.02.015
- MacKinnon, J. G. (1991). Critical Values for Cointegration Tests. Queen's Economics Department Working Paper No. 1227. https://ideas.repec.org/p/qed/wpaper/1227.html
- Murray, M. P. (1994). A Drunk and Her Dog: An Illustration of Cointegration and Error Correction. The American Statistician, 48(1), 37-39. https://doi.org/10.1057/9780230389625
- Krauss, C. (2017). Statistical Arbitrage Pairs Trading Strategies: Review and Outlook. Journal of Economic Surveys, 31(2), 513-545. https://doi.org/10.1111/joes.12153
- Vidyamurthy, G. (2004). Pairs Trading: Quantitative Methods and Analysis. John Wiley & Sons.