अधिकांश मशीन लर्निंग हेज फंड विफल क्यों होते हैं?

López de Prado (2018) ने दस व्यवस्थित विफलता मोड की पहचान की, जिनमें सबसे प्रचलित हैं इन-सैंपल नॉइज़ पर ओवरफिटिंग, वित्तीय टाइम सीरीज़ की सीरियल निर्भरता को अनदेखा करने वाली मानक क्रॉस-वैलिडेशन तकनीकों का अनुप्रयोग, और यथार्थवादी लेनदेन लागतों की उपेक्षा। कई ML फंड वित्तीय भविष्यवाणी को सामान्य सुपरवाइज़्ड लर्निंग समस्या मानते हैं, वित्तीय बाज़ारों के विशिष्ट कम सिग्नल-टू-नॉइज़ अनुपात, गैर-स्थिरता और प्रतिकूल गतिशीलता को अनदेखा करते हैं।

क्या मशीन लर्निंग वास्तव में स्टॉक रिटर्न की भविष्यवाणी कर सकती है?

हां, लेकिन महत्वपूर्ण शर्तों के साथ। Gu, Kelly और Xiu (2020) ने प्रदर्शित किया कि न्यूरल नेटवर्क अमेरिकी स्टॉक रिटर्न के लिए सार्थक आउट-ऑफ-सैंपल भविष्यवाणी शक्ति प्राप्त करते हैं, पारंपरिक मॉडल द्वारा छूटने वाली गैर-रैखिक फैक्टर अंतःक्रियाओं को पकड़ते हैं। हालांकि, भविष्यवाणी R-स्क्वायर्ड केवल 0.40% है — छोटा लेकिन संस्थागत स्तर पर आर्थिक रूप से महत्वपूर्ण।

क्वांट निवेश में मशीन लर्निंग: वास्तविक बढ़त या ओवरफिटिंग?

वह एल्गोरिदम जो बहुत ज़्यादा जानता था

Data analysis and financial analytics visualization

2017 में, एक प्रमुख सिस्टमैटिक हेज फंड ने $1.5 बिलियन की पूंजी, शीर्ष प्रौद्योगिकी कंपनियों से भर्ती किए गए मशीन लर्निंग PhD विशेषज्ञों की टीम और एक आकर्षक प्रस्ताव के साथ लॉन्च किया: डीप न्यूरल नेटवर्क पारंपरिक क्वांट मॉडलों को अदृश्य रिटर्न-प्रेडिक्टिव पैटर्न खोजेंगे। अठारह महीनों के भीतर, फंड ने अपनी एक तिहाई संपत्ति खो दी — बाज़ार में गिरावट के कारण नहीं, बल्कि एक ऐसे मॉडल के धीमे नुकसान के कारण जिसने बाज़ार सीखने के बजाय ट्रेनिंग डेटा को रट लिया था। जो पैटर्न उसने पहचाने वे भूतिया थे: ऐसी सांख्यिकीय कलाकृतियां जो ऐतिहासिक डेटा में तो मौजूद थीं लेकिन लाइव ट्रेडिंग के संपर्क में आते ही विलीन हो गईं।

यह कहानी अनोखी नहीं है। उद्योग के अधिकांश अनुमानों के अनुसार, 2015 के बाद से लॉन्च किए गए ML-संचालित क्वांट फंडों में से अधिकांश बंद हो चुके हैं या अपने बेंचमार्क से काफ़ी पीछे रहे हैं। फिर भी एसेट प्राइसिंग में मशीन लर्निंग के लिए अकादमिक प्रमाण पहले से कहीं ज़्यादा मज़बूत हैं। Gu, Kelly, और Xiu (2020) ने प्रदर्शित किया कि न्यूरल नेटवर्क 0.40% के आउट-ऑफ-सैंपल R-squared के साथ व्यक्तिगत स्टॉक रिटर्न का पूर्वानुमान लगा सकते हैं और 1.8 से अधिक शार्प रेशियो वाले लॉन्ग-शॉर्ट पोर्टफोलियो बना सकते हैं। Kelly, Malamud, और Zhou (2024) ने दिखाया कि मॉडल जटिलता, सामान्यीकरण की दुश्मन होने के बजाय, वास्तव में भविष्यवाणियों में सुधार कर सकती है जब सिग्नल वातावरण में कई कमज़ोर प्रेडिक्टर्स होते हैं।

इन दो वास्तविकताओं में सामंजस्य कैसे बैठाएं? उत्तर इसमें नहीं है कि मशीन लर्निंग निवेश के लिए काम करती है या नहीं — प्रमाण कहते हैं कि यह कर सकती है — बल्कि इस खाई में है कि ML वास्तविक सिग्नल पकड़ती है, यह जानने और बिना शोर में ओवरफिटिंग किए ऐसा करने वाली प्रणाली बनाने के बीच। यही भेद आधुनिक क्वांटिटेटिव फाइनेंस की केंद्रीय चुनौती है।

ML के लिए प्रमाण सबसे मज़बूत कहां हैं

रिटर्न भविष्यवाणी में मशीन लर्निंग का मामला एक विशिष्ट अनुभवजन्य निष्कर्ष पर टिका है: स्टॉक रिटर्न सैकड़ों विशेषताओं के बीच नॉनलीनियर इंटरैक्शन द्वारा संचालित होते हैं, और ये इंटरैक्शन बाज़ार की स्थितियों के साथ बदलते रहते हैं। पारंपरिक लीनियर फैक्टर मॉडल — CAPM से लेकर Fama-French फाइव-फैक्टर मॉडल तक — प्रत्येक प्रेडिक्टर को स्वतंत्र रूप से मानते हैं और स्थिर गुणांक अनुमानित करते हैं। वे प्रथम-क्रम प्रभावों को पकड़ते हैं लेकिन उस सशर्त संरचना को चूक जाते हैं जिसमें अतिरिक्त भविष्यसूचक सामग्री होती है।

Gu, Kelly, और Xiu ने 1957 से 2016 तक पूरे CRSP यूनिवर्स पर 900+ फर्म-स्तरीय और मैक्रोइकोनॉमिक प्रेडिक्टर्स का उपयोग करके हर प्रमुख ML पद्धति का परीक्षण किया। उनके तीन-परत न्यूरल नेटवर्क ने सबसे अधिक आउट-ऑफ-सैंपल R-squared हासिल किया और ऐसे लॉन्ग-शॉर्ट पोर्टफोलियो बनाए जिनका जोखिम-समायोजित प्रदर्शन सर्वश्रेष्ठ लीनियर विकल्पों से लगभग दोगुना था। इस लाभ का स्रोत विदेशी अल्फा नहीं बल्कि सशर्त फैक्टर इंटरैक्शन थे: मोमेंटम उच्च-अस्थिरता शासन में शांत बाज़ारों की तुलना में अलग व्यवहार करता है, वैल्यू की भविष्यसूचक शक्ति व्यापार चक्र के साथ उतार-चढ़ाव करती है, और लिक्विडिटी साइज़ के साथ ऐसे तरीकों से इंटरैक्ट करती है जो कोई भी स्थिर-गुणांक मॉडल प्रस्तुत नहीं कर सकता।

इस निष्कर्ष की पुष्टि स्वतंत्र शोध से हुई है। Israel, Kelly, और Moskowitz (2020) ने पुष्टि की कि ML पद्धतियां मुख्य रूप से नॉनलीनियर इंटरैक्शन को मॉडल करने की अपनी क्षमता के माध्यम से मूल्य जोड़ती हैं, न कि पूरी तरह से नए प्रेडिक्टर्स खोजकर। सबसे महत्वपूर्ण इनपुट — मोमेंटम, वैल्यू, साइज़, प्रॉफिटेबिलिटी — वही हैं जिन्हें पारंपरिक फैक्टर इन्वेस्टिंग ने दशकों से पहचाना है। मशीन लर्निंग का योगदान नए वेरिएबल्स खोजने में नहीं बल्कि मौजूदा वेरिएबल्स के सशर्त इंटरैक्शन को मॉडल करने में है।

फाइनेंशियल ML में ओवरफिटिंग की समस्या

अगर सिग्नल वास्तविक है, तो अधिकांश ML फंड क्यों विफल होते हैं? उत्तर यह है कि वित्तीय भविष्यवाणी मशीन लर्निंग के लिए एक गहरा प्रतिकूल वातावरण है, और जो उपकरण इमेज क्लासिफिकेशन, नेचुरल लैंग्वेज प्रोसेसिंग और प्रोटीन फोल्डिंग पर शानदार ढंग से काम करते हैं, वे रिटर्न पर लागू होने पर गुणात्मक रूप से भिन्न चुनौती का सामना करते हैं।

सूक्ष्म सिग्नल, विशाल शोर

0.40% का आउट-ऑफ-सैंपल R-squared का अर्थ है कि व्यक्तिगत स्टॉक रिटर्न भिन्नता का 99.6% अप्रत्याशित शोर है। कंप्यूटर विज़न में, एक अच्छी तरह से प्रशिक्षित मॉडल 95%+ सटीकता के साथ छवियों को वर्गीकृत करता है। नेचुरल लैंग्वेज प्रोसेसिंग में, बड़े भाषा मॉडल कई बेंचमार्क पर मानव-स्तरीय प्रदर्शन प्राप्त करते हैं। वित्त में, साहित्य का सर्वश्रेष्ठ मॉडल रिटर्न भिन्नता का आधा प्रतिशत से भी कम समझाता है। यह असाधारण रूप से कम सिग्नल-टू-नॉइज़ अनुपात का मतलब है कि पर्याप्त क्षमता वाला कोई भी मॉडल शोर में पैटर्न ढूंढ लेगा जब तक कि इसे रोकने के लिए असाधारण सावधानी न बरती जाए।

अस्थिरता (Non-Stationarity)

वित्तीय बाज़ार गैर-स्थिर हैं: डेटा-जनरेटिंग प्रक्रिया समय के साथ बदलती है। अस्थिरता शासन बदलते हैं, संकटों के दौरान सहसंबंध टूट जाते हैं, नियामक परिवर्तन बाज़ार माइक्रोस्ट्रक्चर को बदल देते हैं, और अन्य प्रतिभागियों की रणनीतियां देखे गए पैटर्न के जवाब में विकसित होती हैं। 2010-2020 डेटा पर प्रशिक्षित मॉडल 2025 में मूल रूप से भिन्न बाज़ार का सामना करता है। मानक ML अभ्यास मानता है कि ट्रेनिंग और टेस्ट वितरण एक ही प्रक्रिया से खींचे गए हैं — एक ऐसी धारणा जो वित्त में नियमित रूप से उल्लंघित होती है।

प्रतिकूल गतिशीलता

प्राकृतिक घटनाओं के विपरीत, वित्तीय बाज़ारों में ऐसे प्रतिभागी होते हैं जो सक्रिय रूप से आपकी भविष्यवाणियों के विरुद्ध प्रतिस्पर्धा करते हैं। जब कोई लाभदायक ML सिग्नल व्यापक रूप से ज्ञात हो जाता है, तो अन्य ट्रेडर्स इसका शोषण करते हैं, भीड़ के कारण लेनदेन लागत बढ़ती है, और सिग्नल क्षीण हो जाता है। McLean और Pontiff (2016) ने प्रलेखित किया कि प्रकाशित अकादमिक एनोमलीज़ शोध सार्वजनिक होने पर अपने रिटर्न प्रीमियम का लगभग एक चौथाई खो देती हैं, बाद के डेटा माइनिंग से अतिरिक्त क्षय होता है। बैकटेस्टिंग के जोखिम सीधे ML क्षेत्र में विस्तारित होते हैं: एक मॉडल जो ऐतिहासिक डेटा में पैटर्न का पता लगाता है, वह ठीक उसी प्रकार के सिग्नल का पता लगा रहा हो सकता है जो लाइव बाज़ारों में सबसे तेज़ी से क्षीण होता है।

क्रॉस-वैलिडेशन की विफलताएं

शायद तकनीकी रूप से सबसे हानिकारक मुद्दा यह है कि मानक क्रॉस-वैलिडेशन — ML मॉडल मूल्यांकन की आधारशिला — सीरियल कोरिलेशन की उपस्थिति में विफल हो जाता है। वित्तीय समय श्रृंखलाएं ऑटोकोरिलेटेड हैं: आज का रिटर्न कल के बारे में जानकारी रखता है। मानक k-fold क्रॉस-वैलिडेशन डेटा को ट्रेनिंग और वैलिडेशन सेट में यादृच्छिक रूप से शफल करता है, जिसका अर्थ है कि ट्रेनिंग अवलोकन जो वैलिडेशन अवलोकनों के समयानुसार निकट हैं, मॉडल मूल्यांकन में भविष्य-दर्शी जानकारी लीक करते हैं। k-fold के तहत अच्छी तरह सामान्यीकृत दिखने वाला मॉडल वास्तविक आउट-ऑफ-सैंपल सिग्नल के बजाय केवल अस्थायी निकटता का शोषण कर रहा हो सकता है।

López de Prado (2018) ने इसे अधिकांश ML फंडों की विफलता के दस कारणों में शामिल किया, तर्क देते हुए कि वित्त उद्योग वित्तीय और गैर-वित्तीय भविष्यवाणी समस्याओं के बीच संरचनात्मक अंतरों को ध्यान में रखे बिना प्रौद्योगिकी कंपनियों से ML तकनीकों को पूरी तरह आयात करता है। समाधान — शुद्ध और प्रतिबंधित क्रॉस-वैलिडेशन, जहां वैलिडेशन सेट के निकट के अवलोकनों को ट्रेनिंग से हटा दिया जाता है — अवधारणात्मक रूप से सरल है लेकिन व्यवहार में शायद ही कभी लागू किया जाता है।

अनुशासित ML अभ्यास कैसा दिखता है

विफल ML फंडों और अकादमिक प्रमाणों के बीच का अंतर बड़े पैमाने पर कार्यप्रणाली का अंतर है। जो प्रैक्टिशनर्स निरंतर ML-व्युत्पन्न अल्फा प्रदान करते हैं, वे एक सामान्य अनुशासन साझा करते हैं जो उन्हें ओवरफिट करने वाले बहुमत से अलग करता है।

शुद्ध वॉक-फॉरवर्ड वैलिडेशन

एकल होल्ड-आउट टेस्ट सेट पर मॉडल प्रदर्शन का मूल्यांकन करने के बजाय, अनुशासित प्रैक्टिशनर्स रोलिंग वॉक-फॉरवर्ड वैलिडेशन का उपयोग करते हैं। मॉडल को समय t तक के डेटा पर प्रशिक्षित किया जाता है, t+1 से t+k तक के डेटा पर परीक्षण किया जाता है, फिर विंडो आगे बढ़ती है। महत्वपूर्ण बात यह है कि ऑटोकोरिलेटेड अवलोकनों से सूचना रिसाव को रोकने के लिए ट्रेनिंग और टेस्ट अवधि के बीच एक बफर अवधि (प्रतिबंध) डाली जाती है। Arnott, Harvey, और Markowitz (2019) ने इसे विशेष रूप से ML युग के लिए डिज़ाइन किए गए बैकटेस्टिंग प्रोटोकॉल के रूप में औपचारिक बनाया, यह प्रदर्शित करते हुए कि मानक ट्रेन-टेस्ट विभाजन व्यवस्थित रूप से प्रदर्शन को बढ़ा-चढ़ाकर दर्शाते हैं।

आर्थिक प्रायर्स रेग्युलराइज़ेशन के रूप में

वित्त में सबसे सफल ML कार्यान्वयन समस्या को ब्लैक बॉक्स के रूप में नहीं मानते। वे आर्थिक संरचना को इंडक्टिव बायस के रूप में शामिल करते हैं: कच्चे रिटर्न के बजाय फैक्टर मॉडल अवशेषों को लक्ष्य के रूप में उपयोग करना, नेटवर्क आर्किटेक्चर को ज्ञात जोखिम संरचनाओं का सम्मान करने के लिए बाधित करना, और ऐसी भविष्यवाणियों को दंडित करना जिनके लिए अविश्वसनीय टर्नओवर की आवश्यकता होती है। यह दृष्टिकोण ML को वित्तीय सिद्धांत के प्रतिस्थापन के बजाय उस नॉनलीनियर अवशेष को पकड़ने के उपकरण के रूप में मानता है जो सिद्धांत चूक जाता है।

Israel, Kelly, और Moskowitz ने इस बात पर ज़ोर दिया कि वित्त में ML मॉडलों को "आर्थिक सिद्धांत द्वारा निर्देशित होना चाहिए, उसे प्रतिस्थापित नहीं करना चाहिए।" उनके प्रयोगों ने दिखाया कि फैक्टर संरचना द्वारा बाधित ML पद्धतियां आउट-ऑफ-सैंपल परीक्षणों में अबाधित मॉडलों से बेहतर प्रदर्शन करती हैं — एक निष्कर्ष जो इस भोली धारणा का सीधा खंडन करता है कि अधिक लचीलापन हमेशा बेहतर होता है।

यथार्थवादी लागत मॉडलिंग

ML-पहचाने गए अल्फा का एक बड़ा हिस्सा स्मॉल-कैप और अतरल प्रतिभूतियों में रहता है जहां निष्पादन लागत सबसे अधिक होती है। अकादमिक साहित्य आमतौर पर लागत-पूर्व रिटर्न रिपोर्ट करता है। जब यथार्थवादी लेनदेन लागत लागू की जाती है — बाज़ार प्रभाव को शामिल करते हुए जो औसत दैनिक वॉल्यूम के सापेक्ष ट्रेड साइज़ के साथ बढ़ता है — स्मॉल-कैप ML अल्फा का अधिकांश भाग विलुप्त हो जाता है। अनुशासित प्रैक्टिशनर्स लागत-पश्चात प्रदर्शन का मूल्यांकन करते हैं और कार्यान्वयन योग्य रणनीतियों के बदले कम सकल अल्फा स्वीकार करते हुए पोर्टफोलियो टर्नओवर बाधाओं के लिए स्पष्ट रूप से अनुकूलन करते हैं।

मल्टीपल टेस्टिंग सुधार

Harvey और Liu (2021) ने प्रदर्शित किया कि कई स्पष्ट रूप से महत्वपूर्ण ML सिग्नल "भाग्यशाली फैक्टर" हैं — व्यापक स्पेसिफिकेशन खोज की कलाकृतियां। जब एक शोधकर्ता सैकड़ों मॉडल कॉन्फ़िगरेशन (नेटवर्क गहराई, लर्निंग रेट, फीचर सबसेट, ट्रेनिंग विंडो) आज़माता है और केवल सर्वश्रेष्ठ परिणाम रिपोर्ट करता है, तो झूठा महत्वपूर्ण सिग्नल पाने की संभावना नाटकीय रूप से बढ़ जाती है। Deflated Sharpe Ratio और संबंधित सुधार मूल्यांकित कुल कॉन्फ़िगरेशन की संख्या के लिए समायोजन करते हैं, और अनुशासित प्रैक्टिशनर्स अपने मॉडल की भविष्यसूचक शक्ति घोषित करने से पहले ये समायोजन लागू करते हैं।

Bailey, Borwein, López de Prado, और Zhu (2017) ने इस समस्या को सटीक रूप से मापा, यह दिखाते हुए कि परीक्षित रणनीति संस्करणों की संख्या के साथ बैकटेस्ट ओवरफिटिंग की संभावना तेज़ी से बढ़ती है। सैकड़ों कॉन्फ़िगरेशन का मूल्यांकन करने वाली एक विशिष्ट शोध पाइपलाइन के लिए, सर्वश्रेष्ठ-प्रदर्शन करने वाले मॉडल के वास्तव में सकारात्मक अपेक्षित रिटर्न होने की संभावना 50% से नीचे गिर सकती है — भले ही इन-सैंपल प्रदर्शन असाधारण दिखे।

जटिलता का विरोधाभास

हाल के ML शोध में सबसे प्रतिकूल निष्कर्षों में से एक यह है कि अधिक जटिल मॉडल क्रॉस-सेक्शनल रिटर्न भविष्यवाणी के विशिष्ट क्षेत्र में बेहतर सामान्यीकरण कर सकते हैं, बदतर नहीं। Kelly, Malamud, और Zhou ने प्रदर्शित किया कि ओवरपैरामीटराइज़्ड न्यूरल नेटवर्क — जिनमें ट्रेनिंग अवलोकनों से कहीं अधिक पैरामीटर होते हैं — मितव्ययी मॉडलों से बेहतर प्रदर्शन करते हैं क्योंकि वे अंतर्निहित रेग्युलराइज़ेशन तंत्र के रूप में कार्य करते हैं। ग्रेडिएंट डिसेंट द्वारा पाया गया न्यूनतम-मानक समाधान कई पैरामीटरों में अनुमान जोखिम फैलाता है, किसी भी एकल प्रेडिक्टर को प्रभुत्व करने से रोकता है और मॉडल को सैकड़ों विशेषताओं में कमज़ोर लेकिन वास्तविक सिग्नलों को एकत्र करने की अनुमति देता है।

यह "डबल डिसेंट" घटना का अर्थ है कि मॉडलों को सरल रखने की शास्त्रीय सलाह वास्तव में इक्विटी रिटर्न भविष्यवाणी की विशिष्ट सेटिंग में प्रदर्शन को नुकसान पहुंचा सकती है, जहां सिग्नल वास्तव में कई कमज़ोर प्रेडिक्टर्स में बिखरा हुआ है। हालांकि, यह परिणाम केवल विशिष्ट शर्तों के तहत ही लागू होता है: मॉडल को उचित रेग्युलराइज़ेशन (स्पष्ट या अंतर्निहित) के साथ प्रशिक्षित किया जाना चाहिए, सख्त आउट-ऑफ-सैंपल प्रोटोकॉल के साथ मान्य किया जाना चाहिए, और यथार्थवादी लागत धारणाओं के साथ मूल्यांकन किया जाना चाहिए। जटिलता एक गुण है केवल तब जब उसके साथ वह अनुशासन हो जो इसे ओवरफिट करने का लाइसेंस बनने से रोके।

व्यावहारिक निहितार्थ सूक्ष्म है। ओवरफिटिंग का शास्त्रीय भय गलत नहीं है — यह केवल अपूर्ण है। वित्त में, खतरा जटिलता अपने आप में नहीं बल्कि अनुशासनहीन जटिलता है: ऐसे मॉडल जो बड़े और लचीले हैं लेकिन उचित वैलिडेशन, आर्थिक प्रायर्स और लागत-सचेत मूल्यांकन की सुरक्षा रेलिंग के बिना।

ML क्वांट रणनीतियों का मूल्यांकन कैसे करें

ML-संचालित रणनीतियों में आवंटन पर विचार करने वाले निवेशकों के लिए, शोध एक ठोस मूल्यांकन ढांचा सुझाता है।

पहला, वैलिडेशन कार्यप्रणाली को समझें। किसी भी विश्वसनीय ML रणनीति को प्रतिबंध अवधि के साथ शुद्ध वॉक-फॉरवर्ड वैलिडेशन का उपयोग करना चाहिए। यदि प्रदर्शन रिकॉर्ड एक साधारण 80/20 ट्रेन-टेस्ट विभाजन पर आधारित है, तो रिपोर्ट किए गए आंकड़े लगभग निश्चित रूप से बढ़े-चढ़े हैं। विशेष रूप से पूछें कि ट्रेनिंग डेटा में सीरियल कोरिलेशन को कैसे संभाला जाता है।

दूसरा, लागत-पश्चात प्रदर्शन की मांग करें। सकल शार्प रेशियो उन रणनीतियों के लिए अर्थहीन हैं जो अतरल प्रतिभूतियों में बार-बार ट्रेड करती हैं। प्रासंगिक मेट्रिक यथार्थवादी बिड-आस्क स्प्रेड, वास्तविक पोर्टफोलियो आकार के अनुसार मापा गया मार्केट इम्पैक्ट अनुमान, और शॉर्ट पोज़ीशन के लिए उधार लागत काटने के बाद शुद्ध अल्फा है। 1.8 का सकल शार्प रेशियो शुद्ध रूप से 0.6 हो सकता है — अभी भी सकारात्मक, लेकिन मूल रूप से भिन्न प्रस्ताव।

तीसरा, शासन मज़बूती की जांच करें। एक मॉडल जो ट्रेंडिंग बाज़ारों में शानदार प्रदर्शन करता है लेकिन अस्थिरता स्पाइक के दौरान ध्वस्त हो जाता है, संभवतः एक ऐसे मोमेंटम सिग्नल को पकड़ रहा है जो तनाव अवधि में उलट जाता है। वास्तविक ML अल्फा को विभिन्न बाज़ार वातावरणों में बाइनरी ऑन/ऑफ व्यवहार प्रदर्शित करने के बजाय धीरे-धीरे क्षीण होना चाहिए। अस्थिरता शासन, बाज़ार दिशा और लिक्विडिटी स्थितियों के अनुसार प्रदर्शन एट्रिब्यूशन की मांग करें।

चौथा, मॉडल व्याख्यात्मकता के बारे में पूछें। हालांकि मॉडल के काम करने के लिए व्याख्यात्मकता आवश्यक नहीं है, एक टीम जो यह नहीं समझा सकती कि उनका मॉडल क्या पकड़ रहा है — कम से कम उच्च स्तर पर — शायद यह नहीं समझती कि यह कब और क्यों विफल होगा। सर्वश्रेष्ठ ML प्रैक्टिशनर्स उस आर्थिक तंत्र को स्पष्ट कर सकते हैं जिसका उनका मॉडल शोषण करता है: सशर्त फैक्टर इंटरैक्शन, समय-परिवर्तनशील जोखिम प्रीमिया, या माइक्रोस्ट्रक्चर-संचालित सिग्नल। बिना किसी आर्थिक कथा वाला शुद्ध ब्लैक बॉक्स अधिक संदेह का पात्र है।

आगे का रास्ता

मशीन लर्निंग न तो निवेश में मानवीय निर्णय का अंत है और न ही कोई गारंटीशुदा बढ़त। अकादमिक प्रमाण स्थापित करते हैं कि ML पद्धतियां वास्तव में क्रॉस-सेक्शनल रिटर्न में भविष्यसूचक सिग्नल पकड़ती हैं — ऐसा सिग्नल जो विदेशी नए वेरिएबल्स के बजाय सशर्त, नॉनलीनियर फैक्टर इंटरैक्शन से आता है। लेकिन इस अकादमिक निष्कर्ष और एक लाभदायक, टिकाऊ निवेश रणनीति के बीच की दूरी बहुत बड़ी है। इसके लिए गैर-स्थिर, क्रमिक रूप से सहसंबंधित, प्रतिकूल डेटा के लिए डिज़ाइन की गई वैलिडेशन पद्धतियों की आवश्यकता है; ऐसे आर्थिक प्रायर्स जो मॉडल को शोर में फिट होने से रोकें; यथार्थवादी लागत मॉडलिंग जो ML अल्फा में अतरलता प्रीमियम को स्वीकार करे; और किसी भी ML शोध पाइपलाइन में निहित मल्टीपल टेस्टिंग के लिए ईमानदार लेखांकन।

जो फंड इस कठिन परीक्षा से बचते हैं वे सिलिकॉन वैली डेटा साइंस दुकानों से कम और पारंपरिक सिस्टमैटिक क्वांट फर्मों से अधिक मिलते-जुलते दिखते हैं जिन्होंने ML को कई उपकरणों में से एक के रूप में शामिल किया है। वे सशर्त फैक्टर एक्सपोज़र को मॉडल करने के लिए न्यूरल नेटवर्क का उपयोग करते हैं, लेकिन वे अपने मॉडलों को आर्थिक सिद्धांत में आधारित रखते हैं। वे वहां जटिलता अपनाते हैं जहां प्रमाण इसका समर्थन करते हैं, लेकिन वे ऐसी कठोरता से मान्य करते हैं जिसे वित्त के बाहर अधिकांश ML प्रैक्टिशनर्स अत्यधिक मानेंगे। वे स्वीकार करते हैं कि 0.40% R-squared एक वास्तविक उपलब्धि है, गोलाई की त्रुटि नहीं, और वे उस पतली बढ़त से अत्यधिक ट्रेडिंग के माध्यम से नष्ट किए बिना मूल्य निकालने के लिए बुनियादी ढांचा बनाते हैं।

सवाल यह नहीं है कि मशीन लर्निंग क्वांट निवेश में काम करती है या नहीं। प्रमाण कहते हैं कि करती है। सवाल यह है कि क्या कार्यान्वयन 0.40% सिग्नल को 99.6% शोर से अलग करने के लिए पर्याप्त अनुशासित है — और क्या वह अनुशासन बाज़ारों के विकास और प्रतिस्पर्धा के तीव्र होने पर भी बनाए रखा जा सकता है।

यह लेख निवेश में ML अनुप्रयोगों पर अकादमिक शोध की जांच करता है। यह किसी भी चर्चित रणनीति में निवेश की सिफारिश नहीं है। मॉडल किए गए प्रदर्शन मेट्रिक्स विशिष्ट अकादमिक अध्ययन शर्तों को दर्शाते हैं और अधिकांश व्यक्तिगत निवेशकों के लिए दोहराने योग्य नहीं हैं।

संदर्भ

Gu, S., Kelly, B., & Xiu, D. (2020). Empirical Asset Pricing via Machine Learning. The Review of Financial Studies, 33(5), 2223-2273. https://doi.org/10.1093/rfs/hhaa009
Kelly, B., Malamud, S., & Zhou, K. (2024). The Virtue of Complexity in Return Prediction. The Journal of Finance, 79(1), 459-503. https://doi.org/10.1111/jofi.13298
López de Prado, M. (2018). The 10 Reasons Most Machine Learning Funds Fail. The Journal of Portfolio Management, 44(6), 120-133. https://doi.org/10.3905/jpm.2018.44.6.120
Israel, R., Kelly, B., & Moskowitz, T. (2020). Can Machines 'Learn' Finance? Journal of Investment Management, 18(2), 23-36. https://ssrn.com/abstract=3624052
Harvey, C. R., & Liu, Y. (2021). Lucky Factors. Journal of Financial Economics, 141(2), 413-435. https://doi.org/10.1016/j.jfineco.2021.04.014
Arnott, R. D., Harvey, C. R., & Markowitz, H. (2019). A Backtesting Protocol in the Era of Machine Learning. The Journal of Financial Data Science, 1(1), 64-74. https://doi.org/10.3905/jfds.2019.1.1.064
McLean, R. D., & Pontiff, J. (2016). Does Academic Research Destroy Stock Return Predictability? The Journal of Finance, 71(1), 5-32. https://doi.org/10.1111/jofi.12365
Bailey, D. H., Borwein, J. M., López de Prado, M., & Zhu, Q. J. (2017). The Probability of Backtest Overfitting. Journal of Computational Finance, 20(4), 39-69. https://doi.org/10.21314/JCF.2017.332