एसेट प्राइसिंग में मशीन लर्निंग: वास्तव में क्या काम करता है

30,000 स्टॉक, 900 प्रेडिक्टर, एक सवाल

1957 से 2016 के बीच, मैक्रोइकोनॉमिक संकेतकों और फर्म विशेषताओं पर प्रशिक्षित एक न्यूरल नेटवर्क ने व्यक्तिगत अमेरिकी स्टॉक रिटर्न के लिए 0.40% का आउट-ऑफ-सैंपल R-स्क्वेयर हासिल किया। यह संख्या छोटी लगती है, लेकिन 30,000 से अधिक स्टॉक के ब्रह्मांड में, रिटर्न भविष्यवाणी में एक छोटा सा भी लाभ आर्थिक रूप से महत्वपूर्ण पोर्टफोलियो लाभ में बदल जाता है। इन न्यूरल नेटवर्क भविष्यवाणियों पर बनाए गए लॉन्ग-शॉर्ट पोर्टफोलियो ने 1.8 से अधिक का शार्प रेशियो अर्जित किया — जो उसी अवधि में सर्वश्रेष्ठ रैखिक मॉडलों द्वारा हासिल किए गए मूल्य से दोगुने से अधिक है।

ये आधुनिक अनुभवजन्य वित्त में सबसे अधिक उद्धृत पत्रों में से एक — "Empirical Asset Pricing via Machine Learning" — के प्रमुख निष्कर्ष हैं। यह पत्र Sheng Gu, Bryan Kelly और Dacheng Xiu द्वारा लिखा गया और 2020 में Review of Financial Studies में प्रकाशित हुआ (Gu, Kelly & Xiu, 2020)। यह पत्र वित्त की मूलभूत समस्या — स्टॉक रिटर्न की भविष्यवाणी — पर लागू हर प्रमुख मशीन लर्निंग विधि के बीच एक व्यवस्थित प्रतिस्पर्धा है, और इसके निष्कर्ष कुशल बाजार शिविर और फैक्टर ज़ू संशयवादियों दोनों को चुनौती देते हैं।

समस्या: बहुत सारे फैक्टर, अपर्याप्त सिग्नल

एसेट प्राइसिंग में एक डेटा समस्या है। पिछले तीन दशकों में, शोधकर्ताओं ने सैकड़ों ऐसे वेरिएबल प्रस्तावित किए हैं जो कथित रूप से स्टॉक रिटर्न की भविष्यवाणी करते हैं। बुक-टू-मार्केट, मोमेंटम, प्रॉफिटेबिलिटी, इन्वेस्टमेंट, एक्रुअल्स, शेयर इश्यूएंस, इडियोसिंक्रेटिक वोलैटिलिटी — यह सूची अब 400 से अधिक प्रकाशित विसंगतियों से आगे निकल गई है। Harvey, Liu और Zhu ने अपने 2016 के पत्र में इस विस्फोट का दस्तावेजीकरण किया, यह तर्क देते हुए कि इनमें से अधिकांश "खोजें" डेटा माइनिंग द्वारा प्रवर्धित सांख्यिकीय शोर हैं (Harvey, Liu & Zhu, 2016)।

इस समस्या के लिए पारंपरिक दृष्टिकोण रैखिक है। कुछ फैक्टर चुनें, रिग्रेशन चलाएं, t-स्टैटिस्टिक्स जांचें। फामा-फ्रेंच पांच-फैक्टर मॉडल पांच वेरिएबल का उपयोग करता है। सबसे महत्वाकांक्षी रैखिक मॉडल भी शायद ही कभी कुछ दर्जन से अधिक का उपयोग करते हैं। कारण सरल है: रैखिक रिग्रेशन गंभीर ओवरफिटिंग के बिना सैकड़ों सहसंबद्ध भविष्यवक्ताओं को संभाल नहीं सकता। रैखिक मॉडल में अधिक वेरिएबल जोड़ने से अंततः भविष्यवाणियां बेहतर नहीं, बल्कि बदतर हो जाती हैं।

मशीन लर्निंग इस गणना को बदल देती है। रैंडम फॉरेस्ट, ग्रेडिएंट-बूस्टेड ट्री और न्यूरल नेटवर्क जैसी विधियां विशेष रूप से उच्च-आयामी, शोरयुक्त डेटा से सिग्नल निकालने के लिए डिज़ाइन की गई हैं। वे वेरिएबलों के बीच गैर-रैखिक संबंधों और अंतःक्रियाओं को पकड़ सकती हैं जो रैखिक मॉडल पूरी तरह से चूक जाते हैं। Gu, Kelly और Xiu ने जो प्रश्न पूछा वह यह था कि क्या ये विधियां, प्रस्तावित सभी स्टॉक भविष्यवक्ताओं के पूर्ण ब्रह्मांड पर लागू होने पर, वास्तव में रिटर्न पूर्वानुमान में सुधार करती हैं।

प्रतिस्पर्धा

पत्र एक व्यापक विधियों का परीक्षण करता है, सभी समान डेटा पर प्रशिक्षित और समान आउट-ऑफ-सैंपल शर्तों के तहत मूल्यांकित। विधियां पारंपरिक अर्थमितीय दृष्टिकोणों से लेकर अत्याधुनिक मशीन लर्निंग तक हैं:

विधि	आउट-ऑफ-सैंपल R²	मासिक शार्प (L/S)
OLS (सभी प्रेडिक्टर)	-1.01%	0.60
OLS (3 प्रेडिक्टर)	0.16%	0.89
Elastic Net	0.21%	1.12
Random Forest	0.23%	1.35
Gradient-Boosted Trees	0.34%	1.51
Neural Network (NN3)	0.40%	1.80
Neural Network (NN5)	0.36%	1.71

इन परिणामों से कई पैटर्न उभरते हैं।

पहला, सभी प्रेडिक्टरों के साथ OLS एक आपदा है। नकारात्मक R-स्क्वेयर का अर्थ है कि OLS भविष्यवाणियों का उपयोग करने की तुलना में हर स्टॉक के लिए ऐतिहासिक औसत रिटर्न की भविष्यवाणी करना बेहतर होता। यह पुष्टि करता है कि उच्च आयामों में रैखिक मॉडल ओवरफिट होते हैं।

दूसरा, रेगुलराइज़ेशन बहुत मदद करता है। Elastic Net, जो गुणांकों को सिकोड़ने और वेरिएबल चयन करने वाले पेनल्टी टर्म के साथ रैखिक रिग्रेशन है, नकारात्मक R-स्क्वेयर को सकारात्मक में बदल देता है। लेकिन सुधार जल्दी ही रुक जाता है क्योंकि Elastic Net अभी भी मूल रूप से रैखिक है।

तीसरा, ट्री-आधारित विधियां रैखिक विधियों से बेहतर प्रदर्शन करती हैं। रैंडम फॉरेस्ट और ग्रेडिएंट-बूस्टेड ट्री प्रेडिक्टरों और रिटर्न के बीच गैर-रैखिक संबंधों को पकड़ते हैं, R-स्क्वेयर को ऊपर धकेलते हैं और शार्प रेशियो को 1.3 से ऊपर ले जाते हैं।

चौथा, न्यूरल नेटवर्क जीतता है। तीन-परत न्यूरल नेटवर्क (NN3) सबसे अधिक आउट-ऑफ-सैंपल R-स्क्वेयर और सबसे अधिक शार्प रेशियो प्राप्त करता है। पांच-परत नेटवर्क (NN5) थोड़ा कम है, जो इस अनुप्रयोग में गहराई से घटते प्रतिफल का सुझाव देता है।

न्यूरल नेटवर्क क्या खोजता है

पत्र का सबसे ज्ञानवर्धक योगदान केवल प्रतिस्पर्धा के परिणाम नहीं हैं बल्कि इस बात का विश्लेषण है कि विजेता मॉडल वास्तव में क्या सीखते हैं। वेरिएबल महत्व विश्लेषण नामक तकनीक का उपयोग करते हुए, लेखक प्रत्येक मॉडल की भविष्यवाणियों को विघटित करते हैं ताकि यह पहचाना जा सके कि कौन से इनपुट पूर्वानुमानों को चलाते हैं।

सभी गैर-रैखिक मॉडलों में प्रमुख प्रेडिक्टर मोमेंटम है — लेकिन सरल 12-महीने का मोमेंटम नहीं। न्यूरल नेटवर्क शॉर्ट-टर्म रिवर्सल (1-महीने के रिटर्न), मीडियम-टर्म मोमेंटम (2-12 महीने), और लॉन्ग-टर्म रिवर्सल (13-60 महीने) के बीच जटिल अंतःक्रियाओं की पहचान करता है जो बाजार की स्थितियों के साथ बदलती हैं। उच्च-अस्थिरता वातावरण में, शॉर्ट-टर्म रिवर्सल हावी होता है। शांत बाजारों में, मीडियम-टर्म मोमेंटम प्रभावी होता है।

दूसरी सबसे महत्वपूर्ण श्रेणी लिक्विडिटी और ट्रेडिंग गतिविधि है। शेयर टर्नओवर, बिड-आस्क स्प्रेड, और डॉलर ट्रेडिंग वॉल्यूम जैसे वेरिएबल साइज़ और मोमेंटम के साथ ऐसे तरीकों से अंतःक्रिया करते हैं जो रैखिक मॉडल पकड़ नहीं सकते।

तीसरा प्रमुख निष्कर्ष मैक्रोइकोनॉमिक अंतःक्रियाओं का महत्व है। न्यूरल नेटवर्क सीखता है कि फर्म विशेषताओं की भविष्यवाणी शक्ति व्यापार चक्र के साथ बदलती है। वैल्यू स्टॉक (उच्च बुक-टू-मार्केट) मंदी के दौरान रिटर्न की अधिक मजबूती से भविष्यवाणी करते हैं, जबकि मोमेंटम विस्तार के दौरान बेहतर काम करता है।

फैक्टर ज़ू को वश में करना

Feng, Giglio और Xiu का सहयोगी पत्र इस बात के लिए अतिरिक्त सैद्धांतिक आधार प्रदान करता है कि इस सेटिंग में मशीन लर्निंग क्यों काम करती है (Feng, Giglio & Xiu, 2020)। उनका फ्रेमवर्क एक मूलभूत प्रश्न को संबोधित करता है: 400+ प्रस्तावित फैक्टरों के साथ, आप कैसे निर्धारित करते हैं कि कौन से वास्तव में जोखिम को पकड़ते हैं और कौन से शोर हैं?

पारंपरिक दृष्टिकोण — मौजूदा मॉडलों के विरुद्ध एक-एक करके फैक्टरों का परीक्षण — सांख्यिकीय रूप से दोषपूर्ण है क्योंकि यह बहु-परीक्षण समस्या की उपेक्षा करता है। 150 से अधिक प्रकाशित फैक्टरों पर लागू करने पर, उन्होंने पाया कि अधिकांश अनावश्यक हैं। बहु-परीक्षण और फैक्टरों के बीच सहसंबंधों को उचित रूप से ध्यान में रखने के बाद, केवल मुट्ठी भर फैक्टर ही बचते हैं।

व्यावहारिक निहितार्थ

व्यावहारिक निहितार्थ इस बात पर काफी निर्भर करते हैं कि आप कौन हैं।

संस्थागत निवेशकों और हेज फंडों के लिए, यह पत्र मात्रात्मक रणनीतियों में मशीन लर्निंग की ओर बदलाव को मान्य करता है। आउट-ऑफ-सैंपल लाभ इतने बड़े हैं कि वे कुशलता से ट्रेड कर सकने वाले पोर्टफोलियो के लिए लेनदेन लागतों को सहन कर सकते हैं।

खुदरा निवेशकों के लिए, निहितार्थ अधिक सूक्ष्म हैं। आप इन रणनीतियों की घर पर नकल नहीं कर सकते। हालांकि, निष्कर्षों के अप्रत्यक्ष निहितार्थ हैं। यदि सच्ची रिटर्न-उत्पन्न प्रक्रिया गैर-रैखिक है तो सरल, स्थिर फैक्टर एक्सपोज़र उपलब्ध प्रीमियम का केवल एक अंश ही पकड़ पाएंगे। यह समझाने में मदद करता है कि फैक्टर ETF अक्सर अपने बैकटेस्ट की तुलना में कम प्रदर्शन क्यों करते हैं।

सीमाएं और अनुत्तरित प्रश्न

पत्र की ताकतें इसकी सीमाएं भी हैं। 60 वर्षों का नमूना काल (1957-2016) कई बाजार शासनों को शामिल करता है, जो सामान्यीकरण के लिए अच्छा है। लेकिन सबसे हालिया दशक — लगभग-शून्य ब्याज दरों, अभूतपूर्व केंद्रीय बैंक हस्तक्षेप, और निष्क्रिय निवेश के उदय द्वारा चिह्नित — एक संरचनात्मक विराम का प्रतिनिधित्व कर सकता है।

सावधानीपूर्ण सैंपल-बाहर डिज़ाइन के बावजूद ओवरफिटिंग एक चिंता बनी हुई है। Kelly, Malamud और Zhou (2024) ने एक बाद के पत्र में इस चिंता को संबोधित किया, जिसमें सैद्धांतिक औचित्य प्रदान किया गया कि जटिल मॉडल उच्च-आयामी सेटिंग्स में केवल ओवरफिट करने के बजाय वास्तव में बेहतर प्रदर्शन क्यों कर सकते हैं (Kelly, Malamud & Zhou, 2024)।

लेनदेन लागतों को स्वीकार किया गया है लेकिन पूरी तरह से शामिल नहीं किया गया है। यथार्थवादी लेनदेन लागत समायोजन के बाद, न्यूरल नेटवर्क का सरल विधियों पर लाभ कम होता है, लेकिन गायब नहीं होता।

बड़ी तस्वीर

Gu, Kelly और Xiu का पत्र अनुभवजन्य एसेट प्राइसिंग में एक महत्वपूर्ण मोड़ है। यह प्रदर्शित करता है कि सांख्यिकीय विधि का चुनाव — रैखिक बनाम गैर-रैखिक, सरल बनाम जटिल — भविष्यवक्ताओं के चुनाव जितना ही महत्वपूर्ण है। दशकों तक, एसेट प्राइसिंग अनुसंधान ने उसी रैखिक रिग्रेशन टूलकिट का उपयोग करते हुए नए वेरिएबल खोजने पर ध्यान केंद्रित किया। यह पत्र दिखाता है कि टूलकिट स्वयं ही बाधा थी।

मात्रात्मक रणनीतियों में निवेश करने वाले किसी भी व्यक्ति के लिए — चाहे हेज फंड, स्मार्ट बीटा ETF, या अपने स्वयं के व्यवस्थित दृष्टिकोण के माध्यम से — इस पत्र का केंद्रीय संदेश स्पष्ट है: विधियां डेटा जितनी ही महत्वपूर्ण हैं, और सबसे सरल मॉडल हमेशा सबसे अच्छा मॉडल नहीं होता।

यह लेख केवल शैक्षिक उद्देश्यों के लिए है और निवेश सलाह नहीं है। पिछला प्रदर्शन भविष्य के परिणामों की गारंटी नहीं देता।

संदर्भ

Gu, S., Kelly, B., & Xiu, D. (2020). Empirical Asset Pricing via Machine Learning. The Review of Financial Studies, 33(5), 2223-2273. https://doi.org/10.1093/rfs/hhaa009
Feng, G., Giglio, S., & Xiu, D. (2020). Taming the Factor Zoo: A Test of New Factors. The Journal of Finance, 75(3), 1327-1370. https://doi.org/10.1111/jofi.12883
Harvey, C. R., Liu, Y., & Zhu, H. (2016). ...and the Cross-Section of Expected Returns. The Review of Financial Studies, 29(1), 5-68. https://doi.org/10.1093/rfs/hhv059
Kelly, B., Malamud, S., & Zhou, K. (2024). The Virtue of Complexity in Return Prediction. The Journal of Finance, 79(1), 459-503. https://doi.org/10.1111/jofi.13298
Fama, E. F., & French, K. R. (2015). A Five-Factor Model of Expected Stock Returns. Journal of Financial Economics, 116(1), 1-22. https://doi.org/10.1016/j.jfineco.2014.10.010