핵심 요약

공적분은 엄밀한 페어 트레이딩을 단순한 상관관계 기반 접근법과 구분하는 수학적 기초입니다. 두 주가는 특정 기간 동안 상관관계가 0이면서도 공적분 관계를 가질 수 있으며, 이는 두 주가의 선형 결합이 안정적인 평균으로 회귀함을 의미합니다. 엥글-그레인저 2단계 방법과 요한센 검정은 이러한 장기 균형 관계를 식별하는 공식적인 통계 도구를 제공합니다. 공적분된 페어가 발견되면 오차수정모형이 스프레드의 행동을 지배하며, 평균회귀 반감기가 거래 기회의 해소 속도를 결정합니다. 공적분에 기반한 페어 트레이딩 전략은 단순한 역사적 가격 근접성에 의존하지 않고 진정한 경제적 관계를 검정하기 때문에 거리 기반 방법보다 구조적 우위를 가집니다.
술 취한 여인과 그녀의 개
늦은 밤 술집을 나서는 한 여인이 목줄에 매인 개와 함께 걷는 상황을 상상할 수 있습니다. 둘 다 다소 무작위로 움직입니다. 여인은 예측할 수 없는 경로를 따라 비틀거리고, 개는 냄새를 쫓아 이리저리 뛰어다닙니다. 개별적으로 보면 어느 쪽도 예측 가능한 궤적을 따르지 않습니다. 그러나 목줄이 둘 사이의 최대 거리를 제약합니다. 각자가 아무리 불규칙하게 움직여도 둘 사이의 거리는 제한되어 있으며 목줄의 길이로 회귀하는 경향이 있습니다.
이것이 바로 공적분의 핵심 이미지입니다. 여인과 개는 각각 비정상 과정(시계열 계량경제학의 용어로 I(1) 시계열)이며, 이는 각각의 위치가 개별적으로 랜덤 워크를 따른다는 것을 의미합니다. 그러나 두 위치의 차이는 정상(I(0))이며, 이는 안정적인 평균 주위를 변동하고 너무 멀리 벗어나면 회귀함을 의미합니다.
이 비유는 종종 Murray (1994)에 귀속되며, 많은 트레이더가 놓치는 미묘한 차이를 포착합니다. 상관관계는 두 시계열이 짧은 구간에서 함께 움직이는 정도를 측정합니다. 공적분은 두 시계열 사이에 장기 균형 관계가 존재하는지를 측정합니다. 두 주식이 높은 상관관계를 가지지만 공적분이 없을 수 있습니다(일별로는 함께 움직이지만 시간이 지남에 따라 영구적으로 괴리됩니다). 반대로, 두 주식이 낮은 단기 상관관계를 가지지만 강한 공적분을 가질 수 있습니다(단기적으로는 다른 경로를 따르지만 가격의 선형 결합은 항상 균형으로 회귀합니다).
정상성과 적분 차수
공적분을 검정하기 전에 적분 차수의 개념을 이해할 필요가 있습니다. 시계열이 d차 적분, 즉 I(d)라 함은 정상화되기 위해 d번의 차분이 필요함을 의미합니다.
대부분의 개별 주가는 I(1)입니다. 수준에서는 드리프트가 있는 랜덤 워크를 따릅니다. 그러나 1차 차분(일별 수익률)은 대략 정상이며 일정한 분산으로 평균 주위를 변동합니다. 단일 I(1) 시계열이 특정 수준으로 회귀할 것이라는 가정 하에 수익성 있는 거래를 할 수 없습니다. 회귀할 고정된 수준이 존재하지 않기 때문입니다.
공적분은 이 문제에 대한 해결책을 제공합니다. 두 I(1) 시계열 X와 Y가 Z = Y - beta * X로 결합될 수 있고, 결과 시계열 Z가 I(0)이면 X와 Y는 공적분 벡터 (1, -beta)로 공적분되어 있습니다. 스프레드 Z가 거래 가능한 양입니다. 고정된 평균을 가지며, 그 평균으로부터의 편차는 일시적입니다.
확장된 디키-풀러(ADF) 검정은 시계열이 정상인지 검정하는 표준 도구입니다. 시계열이 단위근을 가진다(I(1)이다)는 귀무가설을 정상이다(I(0)이다)는 대립가설에 대해 검정합니다. 검정 회귀식은 다음과 같습니다:
Delta_Z(t) = alpha + gamma * Z(t-1) + 시차 Delta_Z 항의 합 + epsilon(t)
gamma가 유의하게 음수이면(검정 통계량이 임계값 아래로 떨어지면) 단위근의 귀무가설을 기각하고 시계열이 정상이라고 결론 내립니다. 공적분 잔차에 대한 임계값은 잔차가 직접 관측된 것이 아니라 추정된 회귀에서 생성되기 때문에 표준 ADF 표와 다릅니다.
엥글-그레인저 2단계 방법
Engle and Granger (1987), 즉 Robert Engle과 Clive Granger에게 2003년 노벨 경제학상을 안겨준 논문은 공적분의 개념을 공식화하고 실용적인 2단계 검정 절차를 도입했습니다.
1단계: 공적분 회귀를 추정합니다. 하나의 I(1) 변수를 다른 변수에 대해 보통최소제곱법(OLS) 회귀를 실행합니다:
Y(t) = alpha + beta * X(t) + epsilon(t)
이 회귀의 잔차는 스프레드를 나타냅니다. 즉, Y가 X와의 추정된 장기 균형 관계에서 벗어난 정도입니다. Y와 X가 공적분되어 있다면 이 잔차는 정상이어야 합니다.
2단계: 잔차의 정상성을 검정합니다. 추정된 잔차에 ADF 검정을 적용합니다. 검정이 단위근의 귀무가설을 기각하면 Y와 X 사이의 공적분을 지지하는 증거가 됩니다. 이 검정의 임계값은 MacKinnon (1991)이 작성한 대로 잔차가 관측된 것이 아니라 추정된 것이기 때문에 표준 ADF 임계값보다 더 엄격합니다.
엥글-그레인저 방법은 직관적이고 구현이 용이하여 페어 트레이딩 연구의 가장 일반적인 출발점으로 남아 있습니다. 그러나 중요한 한계가 있습니다. 두 변수 간의 단일 공적분 관계만 감지할 수 있습니다. 연구자가 어떤 변수를 종속변수로 선택해야 하며(Y와 X를 바꾸면 결론이 달라질 수 있습니다), 1단계 OLS 추정량은 소표본에서 성능이 좋지 않을 수 있습니다.
요한센 검정: 더 강력한 대안
Johansen (1988)은 엥글-그레인저 방법의 한계를 해결하는 최대우도 접근법을 개발했습니다. 요한센 검정은 벡터 자기회귀(VAR) 프레임워크 내에서 작동하며 여러 변수 간의 다중 공적분 관계를 동시에 검정할 수 있습니다.
요한센 검정의 핵심 산출물은 변수 집합 간의 공적분 벡터 수(공적분 순위)입니다. 두 주식에 대한 페어 트레이딩 적용에서 검정은 0개 또는 1개의 공적분 관계가 존재하는지를 결정합니다. 트레이스 통계량과 최대 고유값 통계량이 두 가지 대안 검정 통계량을 제공합니다. 둘 다 최대 r개의 공적분 관계가 존재한다는 귀무가설을 더 많은 관계가 존재한다는 대립가설에 대해 검정합니다.
요한센 접근법은 실무자들에게 여러 장점을 제공합니다. 종속변수를 선택할 필요가 없습니다. 여러 시계열을 동시에 처리하여 트레이더가 공적분된 바스켓(균형을 공유하는 3개 이상의 주식)을 검색할 수 있게 합니다. 그리고 공적분 벡터의 최대우도 추정치를 제공하며, 이는 엥글-그레인저 OLS 추정치보다 점근적으로 더 효율적입니다.
주식 A와 B의 이변량 시스템에서 요한센 순위 1은 공적분을 확인하고 추정된 공적분 벡터를 직접 제공합니다. 순위 0은 공적분이 존재하지 않으며 해당 페어를 평균회귀 스프레드로 거래해서는 안 된다는 것을 의미합니다.
오차수정모형
공적분이 확립되면 오차수정모형(ECM)은 스프레드가 편차를 보일 때 시스템이 균형으로 어떻게 조정되는지를 기술합니다. Engle and Granger (1987)의 그레인저 표현 정리에서 직접 도출된 ECM은 다음과 같은 형태를 가집니다:
Delta_Y(t) = alpha_Y + lambda_Y * Z(t-1) + 시차 항 + epsilon_Y(t)
Delta_X(t) = alpha_X + lambda_X * Z(t-1) + 시차 항 + epsilon_X(t)
여기서 Z(t-1)은 시차 스프레드(오차수정항)이며, lambda 계수는 각 주식이 균형으로 조정되는 속도를 측정합니다. lambda_Y가 음수이고 유의하면 스프레드가 양수일 때(Y가 균형 위에 있을 때) Y가 균형으로 복귀한다는 것을 의미합니다. lambda_X가 양수이고 유의하면 X가 반대 방향으로 움직입니다.
ECM은 어떤 주식이 조정을 수행하는지를 드러내기 때문에 페어 트레이더에게 가치가 있습니다. 많은 실제 페어에서 한 주식이 다른 주식보다 더 빨리 조정됩니다. 트레이더는 더 빨리 조정되는 주식에 더 큰 포지션을 배치하거나 ECM을 사용하여 다음 몇 기간 동안의 스프레드 방향을 예측함으로써 이 비대칭성을 활용할 수 있습니다.
평균회귀의 반감기
공적분된 스프레드가 평균으로 회귀하는 속도는 페어 트레이드가 실질적으로 실행 가능한지를 결정합니다. 2년이 걸려야 회귀하는 스프레드는 통계적으로 흥미롭지만 운영상 쓸모가 없습니다. 5~15거래일 내에 회귀하는 스프레드는 실행 가능합니다.
반감기는 스프레드를 모델링하는 데 사용되는 이산 AR(1) 과정의 연속시간 유사체인 오른스타인-울렌벡(OU) 과정에서 도출됩니다. 스프레드 Z가 다음을 따르면:
Z(t) = phi * Z(t-1) + epsilon(t)
여기서 phi는 자기회귀 계수(정상 과정의 경우 0 < phi < 1)이며, 반감기는 다음과 같습니다:
t_half = -ln(2) / ln(phi)
이 공식은 평균으로부터의 편차가 절반으로 감소하는 데 예상되는 기간 수를 제공합니다. phi가 0.95이면 반감기는 약 13.5거래일을 의미합니다. phi가 0.99이면 반감기는 약 69거래일을 의미합니다.
실용적인 페어 트레이딩에서는 반감기가 5~60거래일 사이인 것이 가장 효과적인 경향이 있습니다. 5일 미만이면 대부분의 실행 시스템이 거래 비용 후 수익성 있게 포착하기에 스프레드가 너무 빨리 회귀합니다. 60일 이상이면 자본이 너무 오래 묶이고 공적분 관계가 붕괴될 위험이 증가합니다.
| 페어 예시 | ADF 통계량 | p-값 | 공적분? | 반감기 (일) | Phi |
|---|---|---|---|---|---|
| KO / PEP | -3.42 | 0.011 | 예 | 18.2 | 0.963 |
| XOM / CVX | -3.89 | 0.003 | 예 | 12.7 | 0.947 |
| JPM / BAC | -2.15 | 0.228 | 아니오 | 43.1 | 0.984 |
| MSFT / AAPL | -1.87 | 0.347 | 아니오 | 61.4 | 0.989 |
| HD / LOW | -3.61 | 0.006 | 예 | 15.3 | 0.956 |
| GLD / GDX | -4.12 | 0.001 | 예 | 8.9 | 0.925 |
실전 구현: 이론에서 거래로
공적분 기반 페어 트레이딩 전략의 구축은 위의 이론에서 직접 매핑되는 체계적인 워크플로를 포함합니다.
첫 번째 단계는 후보 식별입니다. 모든 가능한 주식 쌍을 검정하는 것(심각한 다중 비교 문제를 야기함) 대신, 실무자들은 경제적 논리를 사용하여 대상을 좁힙니다. 동일 산업에 속하고, 유사한 비즈니스 모델을 가지며, 동일한 원자재 투입물에 노출되거나, 동일한 규제 프레임워크의 적용을 받는 주식이 진정한 장기 균형을 공유할 가능성이 더 높습니다. Coca-Cola와 PepsiCo, ExxonMobil과 Chevron, Home Depot과 Lowe's가 대표적인 사례입니다. 경제적 펀더멘털에서 출발하면 통계적으로 유의한 공적분 결과가 데이터 마이닝의 허위 산물일 위험이 줄어듭니다.
두 번째 단계는 롤링 형성 기간(통상 12~24개월의 일별 데이터)에 걸친 공적분 검정입니다. 엥글-그레인저와 요한센 검정을 모두 적용하며, 5% 유의수준에서 두 방법 모두 공적분을 확인하는 페어만 유지합니다. 공적분 벡터(헤지 비율 beta)는 이 기간에서 추정됩니다.
세 번째 단계는 스프레드 구성과 정규화입니다. 스프레드 Z(t) = Y(t) - beta * X(t)를 계산하고 형성 기간의 평균과 표준편차를 사용하여 z-점수로 표준화합니다. 이 정규화를 통해 다양한 페어에 범용 진입 및 청산 임계값을 적용할 수 있습니다.
네 번째 단계는 신호 생성입니다. 표준 접근법은 z-점수가 임계값(통상 2.0 표준편차)을 초과하면 포지션을 개시하고 0으로 회귀하거나 손절 임계값(통상 3.0~4.0 표준편차)을 교차하면 청산합니다. 방향은 z-점수의 부호에 의해 결정됩니다. 양수 z-점수는 Y가 X에 비해 비싸다는 것을 의미하므로 트레이더는 Y를 매도하고 X를 매수합니다. 음수 z-점수는 반대 거래를 촉발합니다.
| 매개변수 | 보수적 | 중립적 | 공격적 |
|---|---|---|---|
| 형성 기간 | 24개월 | 18개월 | 12개월 |
| 진입 임계값 (시그마) | 2.5 | 2.0 | 1.5 |
| 청산 임계값 (시그마) | 0.5 | 0.0 | 0.0 |
| 손절 (시그마) | 4.0 | 3.5 | 3.0 |
| 최대 보유 기간 | 60일 | 40일 | 20일 |
| 반감기 필터 | 5-40일 | 5-50일 | 5-60일 |
실증적 증거: 효과가 있는가?
Gatev, Goetzmann, and Rouwenhorst (2006), 페어 트레이딩에 대한 가장 많이 인용된 실증 연구는 단순한 거리 기반 페어 트레이딩 전략이 1962~2002년 미국 주식에서 약 11%의 연간 초과수익률을 기록했음을 문서화했습니다. 이 전략은 시장 중립적이었으며 펀더멘털 분석이 필요 없었습니다. 순수하게 통계적이었습니다.
그러나 후속 연구는 더 미묘한 이야기를 전달합니다. Do and Faff (2010)은 Gatev 표본을 2008년까지 확장했으며 수익이 상당히 감소했고, 현실적인 거래 비용을 고려하면 대부분의 우위가 사라졌음을 발견했습니다. 2010년대까지 단순 거리 기반 접근법은 비용 차감 후 거의 0 또는 음의 수익을 기록했습니다.
Avellaneda and Lee (2010)은 주성분 분석과 오른스타인-울렌벡 과정을 사용하는 더 정교한 프레임워크를 제안했습니다. 여기서 설명한 공적분 방법론에 더 가까운 이 접근법은 팩터 모형의 잔차를 체계적으로 거래하여 미국 주식에서 1.0 이상의 샤프 비율을 달성했습니다. 핵심 통찰은 평균회귀 속도(OU 매개변수)를 거래 신호에 통합하면 단순 거리 방법에 비해 성능이 크게 향상된다는 것이었습니다.
| 연구 | 기간 | 방법 | 연간 수익률 | 샤프 비율 |
|---|---|---|---|---|
| Gatev et al. (2006) | 1962-2002 | 거리 | ~11% | ~0.75 |
| Do & Faff (2010) | 1962-2009 | 거리 | ~4% (감소 추세) | ~0.35 |
| Avellaneda & Lee (2010) | 1997-2007 | OU / 팩터 | ~8-15% | ~1.0-1.5 |
| Krauss (2017) 서베이 | 다양 | 다양 | 감소 추세 | 전략 의존 |
학술적 합의는 명확합니다. 공적분 기반 및 평균회귀 속도를 인식하는 방법이 단순 거리 방법을 크게 능가했으며, 특히 시장이 더 효율적이 되고 퀀트 트레이더 간의 경쟁이 심화된 최근 기간에 그러합니다.
공적분이 무너지는 경우
공적분은 통계적 관계이지 자연 법칙이 아닙니다. 무너질 수 있고 실제로 무너집니다. 한 기업의 비즈니스 모델의 구조적 변화, 합병이나 인수, 규제 변경, 또는 경쟁 역학의 영구적 변화가 역사적으로 유지되던 균형을 파괴할 수 있습니다. 술 취한 여인과 그녀의 개 사이의 목줄이 끊어지면 스프레드는 영구적으로 발산할 수 있으며, 평균회귀에 기반한 페어 트레이드는 무제한적인 손실을 누적하게 됩니다.
이것이 페어 트레이딩에서 손절 규율이 타협할 수 없는 이유입니다. 또한 공적분 관계의 롤링 재추정이 필수적인 이유이기도 합니다. 실무자들은 통상 1~3개월마다 헤지 비율을 재추정하고 공적분을 재검정하며, 통계 검정을 더 이상 통과하지 못하는 페어를 제외합니다.
다중 비교 문제는 또 다른 중요한 함정입니다. 수천 개의 페어를 검정하고 5% 수준에서 공적분 검정을 통과하는 페어를 선택하면, 우연만으로도 많은 허위 관계가 식별됩니다. 본페로니 보정이나 경제적 필터링(동일 산업 페어로 제한)이 이 문제를 완화하는 데 도움이 되지만, 데이터 기반 페어 선택 과정에서 어느 정도의 과적합은 불가피합니다.
페어에서 바스켓으로: 다변량 확장
요한센 프레임워크는 3개 이상의 공적분된 자산의 바스켓으로 자연스럽게 확장됩니다. 3개의 주식이 2개의 공적분 관계를 공유하면, 트레이더는 2개의 독립적인 평균회귀 스프레드를 구성할 수 있으며, 잠재적으로 분산을 개선하고 단일 페어 관계가 무너질 위험을 줄일 수 있습니다.
Avellaneda and Lee (2010)은 PCA에서 파생된 고유 포트폴리오를 사용하여 섹터 팩터에 대해 구성적으로 정상인 주식 바스켓을 구축했습니다. 이 접근법은 페어 트레이딩을 완전한 통계적 차익거래 프레임워크로 일반화하며, 거래 가능한 평균회귀 신호의 수가 유의미한 고유 포트폴리오 수에 따라 확장됩니다.
수학적 기계는 동일합니다: 공적분 검정, 오차수정 역학, 반감기 추정. 그러나 포트폴리오 구성은 더 복잡해지며, 포지션 사이징, 증거금 요건, 그리고 다중 스프레드 간의 상관 구조에 세심한 주의가 필요합니다.
Written by Sam · Reviewed by Sam
이 기사는 인용된 1차 문헌을 기반으로 하며, 정확성과 출처 표기를 위해 편집팀의 검토를 거쳤습니다. 편집 정책.
참고문헌
- Engle, R. F., & Granger, C. W. J. (1987). Co-Integration and Error Correction: Representation, Estimation, and Testing. Econometrica, 55(2), 251-276. https://doi.org/10.2307/1913236
- Johansen, S. (1988). Statistical analysis of cointegration vectors. Journal of Economic Dynamics and Control, 12(2-3), 231-254. https://doi.org/10.1016/0304-4076(88)90041-3
- Johansen, S. (1991). Estimation and Hypothesis Testing of Cointegration Vectors in Gaussian Vector Autoregressive Models. Econometrica, 59(6), 1551-1580. https://doi.org/10.2307/2938278
- Gatev, E., Goetzmann, W. N., & Rouwenhorst, K. G. (2006). Pairs Trading: Performance of a Relative-Value Arbitrage Rule. Review of Financial Studies, 19(3), 797-827. https://doi.org/10.1093/rfs/hhj020
- Avellaneda, M., & Lee, J.-H. (2010). Statistical arbitrage in the US equities market. Quantitative Finance, 10(7), 761-782. https://doi.org/10.1080/14697680903124632
- Do, B., & Faff, R. (2010). Does simple pairs trading still work? Financial Analysts Journal, 66(4), 83-95. https://doi.org/10.1016/j.jbankfin.2010.02.015
- MacKinnon, J. G. (1991). Critical Values for Cointegration Tests. Queen's Economics Department Working Paper No. 1227. https://ideas.repec.org/p/qed/wpaper/1227.html
- Murray, M. P. (1994). A Drunk and Her Dog: An Illustration of Cointegration and Error Correction. The American Statistician, 48(1), 37-39. https://doi.org/10.1057/9780230389625
- Krauss, C. (2017). Statistical Arbitrage Pairs Trading Strategies: Review and Outlook. Journal of Economic Surveys, 31(2), 513-545. https://doi.org/10.1111/joes.12153
- Vidyamurthy, G. (2004). Pairs Trading: Quantitative Methods and Analysis. John Wiley & Sons.