Sam, Pemimpin Redaksi
Ditinjau oleh Sam · Terakhir ditinjau 2026-04-01
This article synthesizes Engle-Granger and Johansen cointegration testing into a unified pairs trading workflow, connecting the theoretical error correction framework to practical trading parameters including half-life filtering, z-score thresholds, and rolling reestimation protocols.

Kointegrasi: Matematika di Balik Pairs Trading

2026-04-01 · 14 min

Kointegrasi menyediakan kerangka statistik yang ketat untuk membedakan pairs trading yang robust dari pendekatan berbasis korelasi sederhana. Metode dua langkah Engle-Granger dan uji Johansen mengidentifikasi hubungan keseimbangan jangka panjang antar harga saham, sementara model error correction dan half-life Ornstein-Uhlenbeck menentukan seberapa cepat peluang trading terselesaikan.

KointegrasiPairs TradingArbitrase StatistikMean ReversionEngle GrangerJohansen TestError Correction ModelTime Series
Sumber: Quant Decoded Research

Penerapan Praktis untuk Investor Ritel

Sebelum menerapkan strategi pairs trading, menguji kointegrasi pasangan kandidat menggunakan metode Engle-Granger dan Johansen selama jendela formasi 12-24 bulan cenderung lebih menguntungkan untuk membangun strategi yang robust. Menghitung half-life mean reversion dan menyaring pasangan dengan half-life antara 5 dan 60 hari trading memiliki probabilitas lebih tinggi untuk menangkap peluang trading praktis. Threshold z-score 2,0 untuk entry, 0,0 untuk exit, dan stop-loss 3,5 sigma cenderung menjadi pilihan parameter yang umum, dan mengestimasi ulang hedge ratio serta menguji ulang kointegrasi setiap 1 hingga 3 bulan sambil membuang pasangan yang tidak lagi lolos cenderung lebih menguntungkan.

Poin Utama

Analisis data keuangan di layar

Kointegrasi adalah fondasi matematis yang memisahkan pairs trading yang ketat dari pendekatan berbasis korelasi yang naif. Dua harga saham dapat memiliki korelasi nol selama suatu periode namun tetap terkointegrasi, artinya kombinasi liniernya kembali ke mean yang stabil. Metode dua langkah Engle-Granger dan uji Johansen menyediakan alat statistik formal untuk mengidentifikasi hubungan keseimbangan jangka panjang ini. Setelah pasangan terkointegrasi ditemukan, model error correction mengatur perilaku spread, dan half-life mean reversion menentukan seberapa cepat peluang trading terselesaikan. Strategi pairs trading yang dibangun atas kointegrasi memiliki keunggulan struktural dibandingkan metode berbasis jarak karena menguji hubungan ekonomi yang sesungguhnya, bukan mengandalkan kedekatan harga historis.

Wanita Mabuk dan Anjingnya

Bayangkan seorang wanita meninggalkan bar larut malam dengan anjingnya yang ditali. Keduanya berjalan agak acak; wanita itu terhuyung-huyung di jalur yang tidak bisa diprediksi, dan anjingnya berlari ke sana-sini mengejar bau. Secara individu, tak satu pun mengikuti lintasan yang bisa diprediksi. Namun tali mengikat jarak maksimum di antara mereka. Tidak peduli seberapa tak beraturan masing-masing bergerak, jarak di antara mereka tetap terbatas dan cenderung kembali ke panjang tali.

Inilah kointegrasi dalam satu gambaran. Wanita dan anjing masing-masing adalah proses non-stasioner (seri I(1) dalam bahasa ekonometrika time series), artinya posisi mereka secara individual mengikuti random walk. Namun selisih posisi mereka adalah stasioner (I(0)), artinya berfluktuasi di sekitar mean yang stabil dan kembali ketika menyimpang terlalu jauh.

Analogi ini sering diatribusikan kepada Murray (1994), menangkap perbedaan halus yang banyak trader lewatkan. Korelasi mengukur bagaimana dua seri bergerak bersama dalam interval pendek. Kointegrasi mengukur apakah hubungan keseimbangan jangka panjang ada di antara mereka. Dua saham bisa memiliki korelasi tinggi tanpa kointegrasi (bergerak bersama sehari-hari tetapi menyimpang secara permanen seiring waktu). Sebaliknya, dua saham bisa memiliki korelasi jangka pendek rendah tetapi kointegrasi kuat (mengikuti jalur jangka pendek berbeda tetapi kombinasi linier harga mereka selalu kembali ke keseimbangan).

Stasioneritas dan Orde Integrasi

Sebelum menguji kointegrasi, perlu memahami konsep orde integrasi. Sebuah time series adalah terintegrasi orde d, ditulis I(d), jika memerlukan d putaran differencing untuk menjadi stasioner.

Kebanyakan harga saham individual adalah I(1). Dalam level, mereka mengikuti random walk dengan drift. Namun first difference mereka (return harian) kira-kira stasioner, berfluktuasi di sekitar mean dengan varians konstan. Anda tidak bisa secara menguntungkan memperdagangkan seri I(1) tunggal dengan asumsi bahwa ia akan kembali ke level tertentu, karena ia tidak memiliki level tetap untuk dikembalikan.

Kointegrasi menawarkan jalan keluar dari masalah ini. Jika dua seri I(1) X dan Y dapat dikombinasikan sebagai Z = Y - beta * X, dan seri yang dihasilkan Z adalah I(0), maka X dan Y terkointegrasi dengan vektor kointegrasi (1, -beta). Spread Z adalah kuantitas yang bisa diperdagangkan: ia memiliki mean tetap, dan deviasi dari mean tersebut bersifat sementara.

Uji Augmented Dickey-Fuller (ADF) adalah alat standar untuk menguji apakah suatu seri stasioner. Ia menguji hipotesis nol bahwa seri memiliki unit root (adalah I(1)) terhadap alternatif bahwa ia stasioner (adalah I(0)). Regresi uji adalah:

Delta_Z(t) = alpha + gamma * Z(t-1) + jumlah lag Delta_Z + epsilon(t)

Jika gamma secara signifikan negatif (statistik uji jatuh di bawah nilai kritis), kita menolak null unit root dan menyimpulkan seri tersebut stasioner. Nilai kritis untuk residual kointegrasi berbeda dari tabel ADF standar karena residual dihasilkan dari regresi yang diestimasi, bukan diamati langsung.

Metode Dua Langkah Engle-Granger

Engle and Granger (1987), makalah yang menghasilkan Nobel Ekonomi 2003 untuk Robert Engle dan Clive Granger, memformalisasi konsep kointegrasi dan memperkenalkan prosedur pengujian dua langkah yang praktis.

Langkah satu: estimasi regresi kointegrasi. Jalankan regresi ordinary least squares (OLS) dari satu variabel I(1) terhadap yang lain:

Y(t) = alpha + beta * X(t) + epsilon(t)

Residual dari regresi ini mewakili spread: deviasi Y dari hubungan keseimbangan jangka panjang yang diestimasi dengan X. Jika Y dan X terkointegrasi, residual ini seharusnya stasioner.

Langkah dua: uji stasioneritas residual. Terapkan uji ADF pada residual yang diestimasi. Jika uji menolak null unit root, bukti mendukung kointegrasi antara Y dan X. Nilai kritis untuk uji ini lebih ketat dari nilai kritis ADF standar, sebagaimana ditabulasi oleh MacKinnon (1991), karena residual diestimasi bukan diamati.

Metode Engle-Granger intuitif dan mudah diimplementasikan, itulah mengapa ia tetap menjadi titik awal paling umum untuk riset pairs trading. Namun ia memiliki keterbatasan penting. Ia hanya dapat mendeteksi satu hubungan kointegrasi antara dua variabel. Ia mengharuskan peneliti memilih variabel mana yang menjadi variabel dependen (menukar Y dan X bisa mengubah kesimpulan). Dan estimator OLS langkah pertama mungkin berkinerja buruk dalam sampel kecil.

Uji Johansen: Alternatif yang Lebih Kuat

Johansen (1988) mengembangkan pendekatan maximum likelihood yang mengatasi keterbatasan metode Engle-Granger. Uji Johansen bekerja dalam kerangka vector autoregressive (VAR) dan dapat secara simultan menguji beberapa hubungan kointegrasi di antara beberapa variabel.

Output utama uji Johansen adalah jumlah vektor kointegrasi (rank kointegrasi) di antara serangkaian variabel. Untuk aplikasi pairs trading dengan dua saham, uji menentukan apakah nol atau satu hubungan kointegrasi ada. Trace statistic dan maximum eigenvalue statistic menyediakan dua statistik uji alternatif; keduanya menguji hipotesis nol paling banyak r hubungan kointegrasi terhadap alternatif lebih banyak.

Pendekatan Johansen menawarkan beberapa keunggulan bagi praktisi. Tidak perlu memilih variabel dependen. Menangani beberapa time series secara simultan, memungkinkan trader mencari basket terkointegrasi (tiga saham atau lebih yang berbagi keseimbangan). Dan menyediakan estimasi maximum likelihood dari vektor kointegrasi, yang secara asimptotik lebih efisien dari estimasi OLS Engle-Granger.

Untuk sistem bivariat dengan saham A dan B, rank Johansen 1 mengkonfirmasi kointegrasi dan menyediakan vektor kointegrasi yang diestimasi secara langsung. Rank 0 berarti tidak ada kointegrasi, dan pasangan tersebut tidak boleh diperdagangkan sebagai spread mean-reverting.

Model Error Correction

Setelah kointegrasi terbentuk, model error correction (ECM) mendeskripsikan bagaimana sistem menyesuaikan kembali menuju keseimbangan ketika spread menyimpang. ECM, diturunkan langsung dari Granger representation theorem dalam Engle and Granger (1987), berbentuk:

Delta_Y(t) = alpha_Y + lambda_Y * Z(t-1) + lag terms + epsilon_Y(t)

Delta_X(t) = alpha_X + lambda_X * Z(t-1) + lag terms + epsilon_X(t)

Di sini Z(t-1) adalah lagged spread (error correction term), dan koefisien lambda mengukur kecepatan penyesuaian setiap saham menuju keseimbangan. Jika lambda_Y negatif dan signifikan, berarti Y bergerak kembali ke keseimbangan ketika spread positif (Y di atas keseimbangan). Jika lambda_X positif dan signifikan, X bergerak ke arah sebaliknya.

ECM bernilai bagi pairs trader karena mengungkap saham mana yang melakukan penyesuaian. Dalam banyak pasangan riil, satu saham menyesuaikan lebih cepat dari yang lain. Trader dapat mengeksploitasi asimetri ini dengan menempatkan posisi lebih besar pada saham yang menyesuaikan lebih cepat, atau menggunakan ECM untuk memperkirakan arah spread selama beberapa periode ke depan.

Half-Life Mean Reversion

Kecepatan spread terkointegrasi kembali ke mean-nya menentukan apakah pairs trade secara praktis layak. Spread yang memerlukan dua tahun untuk kembali secara statistik menarik tetapi secara operasional tidak berguna; spread yang kembali dalam lima hingga lima belas hari trading dapat ditindaklanjuti.

Half-life diturunkan dari proses Ornstein-Uhlenbeck (OU), analog waktu kontinu dari proses diskrit AR(1) yang digunakan untuk memodelkan spread. Jika spread Z mengikuti:

Z(t) = phi * Z(t-1) + epsilon(t)

di mana phi adalah koefisien autoregresif (0 < phi < 1 untuk proses stasioner), maka half-life adalah:

t_half = -ln(2) / ln(phi)

Formula ini memberikan jumlah periode yang diharapkan untuk deviasi dari mean meluruh setengahnya. Phi sebesar 0,95 mengimplikasikan half-life sekitar 13,5 hari trading. Phi sebesar 0,99 mengimplikasikan half-life sekitar 69 hari trading.

Untuk pairs trading praktis, half-life antara 5 dan 60 hari trading cenderung bekerja paling baik. Di bawah 5 hari, spread kembali terlalu cepat bagi kebanyakan sistem eksekusi untuk ditangkap secara menguntungkan setelah biaya transaksi. Di atas 60 hari, modal terikat terlalu lama dan risiko rusaknya hubungan kointegrasi meningkat.

Contoh PasanganStatistik ADFp-valueTerkointegrasi?Half-Life (hari)Phi
KO / PEP-3,420,011Ya18,20,963
XOM / CVX-3,890,003Ya12,70,947
JPM / BAC-2,150,228Tidak43,10,984
MSFT / AAPL-1,870,347Tidak61,40,989
HD / LOW-3,610,006Ya15,30,956
GLD / GDX-4,120,001Ya8,90,925

Implementasi Praktis: Dari Teori ke Trading

Membangun strategi pairs trading berbasis kointegrasi melibatkan alur kerja sistematis yang langsung dipetakan dari teori di atas.

Tahap pertama adalah identifikasi kandidat. Daripada menguji semua pasangan saham yang mungkin (yang menciptakan masalah perbandingan berganda yang serius), praktisi mempersempit universe menggunakan logika ekonomi. Saham dalam industri yang sama, dengan model bisnis serupa, terpapar input komoditas yang sama, atau tunduk pada kerangka regulasi yang sama lebih mungkin berbagi keseimbangan jangka panjang yang sesungguhnya. Coca-Cola dan PepsiCo, ExxonMobil dan Chevron, Home Depot dan Lowe's adalah contoh klasik. Memulai dari fundamental ekonomi mengurangi risiko bahwa hasil kointegrasi yang signifikan secara statistik adalah artefak palsu dari data mining.

Tahap kedua adalah pengujian kointegrasi selama jendela formasi bergulir, biasanya 12 hingga 24 bulan data harian. Uji Engle-Granger dan Johansen diterapkan, dengan pasangan hanya dipertahankan jika kedua metode mengkonfirmasi kointegrasi pada level signifikansi 5%. Vektor kointegrasi (hedge ratio beta) diestimasi dari jendela ini.

Tahap ketiga adalah konstruksi dan normalisasi spread. Spread Z(t) = Y(t) - beta * X(t) dihitung dan distandardisasi ke z-score menggunakan mean dan standar deviasi periode formasi. Normalisasi ini memungkinkan threshold entry dan exit universal diterapkan di berbagai pasangan.

Tahap keempat adalah generasi sinyal. Pendekatan standar membuka posisi ketika z-score melampaui threshold (biasanya 2,0 standar deviasi) dan menutup ketika kembali ke nol atau melewati threshold stop-loss (biasanya 3,0 hingga 4,0 standar deviasi). Arah ditentukan oleh tanda z-score: z-score positif berarti Y mahal relatif terhadap X, jadi trader short Y dan beli X; z-score negatif memicu trade berlawanan.

ParameterKonservatifModeratAgresif
Jendela formasi24 bulan18 bulan12 bulan
Threshold entry (sigma)2,52,01,5
Threshold exit (sigma)0,50,00,0
Stop-loss (sigma)4,03,53,0
Periode holding maks60 hari40 hari20 hari
Filter half-life5-40 hari5-50 hari5-60 hari

Bukti Empiris: Apakah Berhasil?

Gatev, Goetzmann, and Rouwenhorst (2006), studi empiris pairs trading yang paling banyak dikutip, mendokumentasikan bahwa strategi pairs trading berbasis jarak sederhana menghasilkan return excess tahunan sekitar 11% selama 1962 hingga 2002 di ekuitas AS. Strategi ini market-neutral dan tidak memerlukan analisis fundamental; murni statistikal.

Namun riset selanjutnya menceritakan kisah yang lebih bernuansa. Do and Faff (2010) memperluas sampel Gatev hingga 2008 dan menemukan bahwa profit telah menurun substansial, dengan sebagian besar keunggulan menghilang setelah memperhitungkan biaya transaksi realistis. Pada 2010-an, pendekatan berbasis jarak sederhana menghasilkan return mendekati nol atau negatif setelah biaya.

Avellaneda and Lee (2010) mengusulkan kerangka yang lebih canggih menggunakan principal component analysis dan proses Ornstein-Uhlenbeck. Pendekatan mereka, yang lebih dekat dengan metodologi kointegrasi yang dijelaskan di sini, mencapai Sharpe ratio di atas 1,0 di ekuitas AS dengan secara sistematis memperdagangkan residual dari model faktor. Insight kunci adalah bahwa memasukkan kecepatan mean-reversion (parameter OU) ke dalam sinyal trading meningkatkan kinerja secara signifikan dibandingkan metode jarak sederhana.

StudiPeriodeMetodeReturn TahunanSharpe Ratio
Gatev et al. (2006)1962-2002Jarak~11%~0,75
Do & Faff (2010)1962-2009Jarak~4% (menurun)~0,35
Avellaneda & Lee (2010)1997-2007OU / Faktor~8-15%~1,0-1,5
Krauss (2017) surveiBeragamBeragamTren menurunTergantung strategi

Konsensus akademis jelas: metode berbasis kointegrasi dan yang memperhatikan kecepatan mean-reversion secara signifikan mengungguli metode jarak sederhana, terutama dalam periode yang lebih baru ketika pasar menjadi lebih efisien dan kompetisi di antara trader kuantitatif semakin intensif.

Ketika Kointegrasi Rusak

Kointegrasi adalah hubungan statistik, bukan hukum alam. Ia bisa dan memang rusak. Perubahan struktural dalam model bisnis satu perusahaan, merger atau akuisisi, pergeseran regulasi, atau perubahan permanen dalam dinamika kompetitif dapat menghancurkan keseimbangan yang secara historis bertahan. Ketika tali antara wanita mabuk dan anjingnya putus, spread bisa menyimpang secara permanen, dan pairs trade berbasis mean reversion akan mengakumulasi kerugian tanpa batas.

Inilah mengapa disiplin stop-loss tidak bisa ditawar dalam pairs trading. Ini juga mengapa re-estimasi bergulir dari hubungan kointegrasi sangat penting. Praktisi biasanya mengestimasi ulang hedge ratio dan menguji ulang kointegrasi setiap satu hingga tiga bulan, membuang pasangan yang tidak lagi lolos uji statistik.

Masalah perbandingan berganda adalah jebakan kritis lainnya. Menguji ribuan pasangan dan memilih yang lolos uji kointegrasi pada level 5%, secara kebetulan saja, akan mengidentifikasi banyak hubungan palsu. Koreksi Bonferroni atau filter ekonomi (membatasi pada pasangan satu industri) membantu meringankan masalah ini, tetapi tingkat overfitting tertentu tidak terhindarkan dalam proses seleksi pasangan berbasis data.

Dari Pairs ke Basket: Ekstensi Multivariat

Kerangka Johansen secara alami meluas ke basket tiga atau lebih aset terkointegrasi. Jika tiga saham berbagi dua hubungan kointegrasi, trader dapat mengkonstruksi dua spread mean-reverting independen, berpotensi meningkatkan diversifikasi dan mengurangi risiko rusaknya satu hubungan pasangan.

Avellaneda and Lee (2010) menggunakan eigenportfolio yang diturunkan dari PCA untuk mengkonstruksi basket saham yang stasioner secara konstruksi relatif terhadap faktor sektoral mereka. Pendekatan ini menggeneralisasi pairs trading ke kerangka arbitrase statistik penuh, di mana jumlah sinyal mean-reverting yang bisa diperdagangkan meningkat seiring jumlah eigenportfolio yang signifikan.

Mesin matematisnya sama: pengujian kointegrasi, dinamika error correction, estimasi half-life. Namun konstruksi portofolio menjadi lebih kompleks, memerlukan perhatian cermat terhadap position sizing, persyaratan margin, dan struktur korelasi di antara beberapa spread.

Written by Sam · Reviewed by Sam

Artikel ini berdasarkan literatur primer yang dikutip dan telah ditinjau oleh tim editorial kami untuk akurasi dan atribusi. Kebijakan Editorial.

Referensi

Penilaian bukti

  • 5/5Engle and Granger (1987) formalized cointegration theory and the error correction representation, earning the 2003 Nobel Prize in Economics for methods of analyzing non-stationary time series
  • 4/5Cointegration-based and mean-reversion-speed-aware pairs trading methods have outperformed simple distance-based approaches, with Avellaneda and Lee (2010) achieving Sharpe ratios above 1.0 using Ornstein-Uhlenbeck models
  • 4/5Simple distance-based pairs trading returns declined from approximately 11% annualized (1962-2002) to near zero after transaction costs by the 2010s, while cointegration methods have retained more of their edge

Pertanyaan yang Sering Diajukan

Apa perbedaan antara korelasi dan kointegrasi dalam pairs trading?
Korelasi mengukur seberapa besar dua seri harga bergerak bersama dalam interval pendek, sementara kointegrasi menguji apakah hubungan keseimbangan jangka panjang ada di antara keduanya. Dua saham bisa memiliki korelasi tinggi tanpa kointegrasi, artinya bergerak bersama secara harian tetapi menyimpang secara permanen seiring waktu. Sebaliknya, saham yang terkointegrasi mungkin memiliki korelasi jangka pendek rendah tetapi kombinasi liniernya selalu kembali ke mean yang stabil. Pairs trading berbasis kointegrasi mengeksploitasi spread mean-reverting ini, memberikan fondasi yang lebih ketat secara statistik dibandingkan korelasi saja.
Bagaimana cara menghitung half-life mean reversion untuk pairs trade?
Half-life diturunkan dari proses Ornstein-Uhlenbeck. Pertama, fit model AR(1) ke spread: Z(t) = phi * Z(t-1) + epsilon. Koefisien autoregresif phi harus antara 0 dan 1 agar spread mean-reverting. Kemudian terapkan formula: t_half = -ln(2) / ln(phi). Misalnya, phi sebesar 0.95 memberikan half-life sekitar 13,5 hari trading, artinya deviasi dari mean berkurang setengahnya dalam sekitar dua setengah minggu. Rentang praktis untuk pasangan yang dapat diperdagangkan adalah 5 hingga 60 hari.
Apa saja risiko utama dari pairs trading berbasis kointegrasi?
Risiko utama adalah rusaknya hubungan kointegrasi, bias perbandingan berganda, dan tantangan eksekusi. Perubahan struktural seperti merger, pergeseran regulasi, atau perubahan model bisnis dapat menghancurkan hubungan keseimbangan secara permanen, menyebabkan spread menyimpang tanpa batas. Menguji ribuan pasangan menciptakan masalah perbandingan berganda di mana banyak hasil yang signifikan secara statistik sebenarnya palsu. Selain itu, biaya transaksi menggerus profit secara signifikan karena pairs trade melibatkan empat kaki (dua entry, dua exit) dan mungkin memerlukan rebalancing hedge ratio yang sering.

Konten edukasi saja.