Sam, प्रधान संपादक
समीक्षक Sam · अंतिम समीक्षा 2026-04-06

क्वांट निवेश में मशीन लर्निंग: वास्तविक बढ़त या ओवरफिटिंग?

2026-04-06 · 18 min

न्यूरल नेटवर्क 1.8 से अधिक शार्प रेशियो के साथ स्टॉक रिटर्न की भविष्यवाणी कर सकते हैं। लेकिन अधिकांश ML-संचालित हेज फंड अपने बेंचमार्क से कम प्रदर्शन करते हैं। यह गहन विश्लेषण वास्तविक ML अल्फा और परिष्कृत कर्व-फिटिंग को अलग करने वाले शोध की जांच करता है, और अनुशासित प्रैक्टिशनर क्या अलग करते हैं।

मशीन लर्निंगओवरफिटिंगCross ValidationQuant InvestingSystematic Strategies
स्रोत: Gu, Kelly & Xiu (2020), Review of Financial Studies

खुदरा निवेशकों के लिए व्यावहारिक उपयोग

किसी भी ML-संचालित फंड या रणनीति में आवंटन से पहले तीन प्रश्नों की पुष्टि करना महत्वपूर्ण है: क्या ट्रैक रिकॉर्ड सरल ट्रेन-टेस्ट स्प्लिट की बजाय पर्ज्ड वॉक-फॉरवर्ड वैलिडेशन का उपयोग करता है? क्या प्रदर्शन आंकड़े यथार्थवादी लेनदेन लागत के बाद रिपोर्ट किए गए हैं? क्या रणनीति आउट-ऑफ-सैंपल रेजीम में धीरे-धीरे कमजोर होती है, या अचानक प्रदर्शन गिरावट दिखाती है? तीनों फिल्टर पास करने वाली रणनीतियों में वास्तविक अल्फा देने की संभावना कहीं अधिक होती है।

संपादकीय टिप्पणी

ML-ब्रांडेड क्वांट फंड 2025-2026 में रिकॉर्ड पूंजी आकर्षित कर रहे हैं, ऐसे में वास्तविक भविष्यवाणी संकेत और विस्तृत ओवरफिटिंग के बीच का अंतर पहले से कहीं अधिक महत्वपूर्ण हो गया है। यह लेख उन शैक्षणिक साक्ष्यों को संश्लेषित करता है जहां मशीन लर्निंग वास्तव में रिटर्न भविष्यवाणी को आगे बढ़ाती है और जहां यह केवल शोर को परिष्कार के रूप में पुनर्पैक करती है।

वह एल्गोरिदम जो बहुत ज़्यादा जानता था

Data analysis and financial analytics visualization

2017 में, एक प्रमुख सिस्टमैटिक हेज फंड ने $1.5 बिलियन की पूंजी, शीर्ष प्रौद्योगिकी कंपनियों से भर्ती किए गए मशीन लर्निंग PhD विशेषज्ञों की टीम और एक आकर्षक प्रस्ताव के साथ लॉन्च किया: डीप न्यूरल नेटवर्क पारंपरिक क्वांट मॉडलों को अदृश्य रिटर्न-प्रेडिक्टिव पैटर्न खोजेंगे। अठारह महीनों के भीतर, फंड ने अपनी एक तिहाई संपत्ति खो दी — बाज़ार में गिरावट के कारण नहीं, बल्कि एक ऐसे मॉडल के धीमे नुकसान के कारण जिसने बाज़ार सीखने के बजाय ट्रेनिंग डेटा को रट लिया था। जो पैटर्न उसने पहचाने वे भूतिया थे: ऐसी सांख्यिकीय कलाकृतियां जो ऐतिहासिक डेटा में तो मौजूद थीं लेकिन लाइव ट्रेडिंग के संपर्क में आते ही विलीन हो गईं।

यह कहानी अनोखी नहीं है। उद्योग के अधिकांश अनुमानों के अनुसार, 2015 के बाद से लॉन्च किए गए ML-संचालित क्वांट फंडों में से अधिकांश बंद हो चुके हैं या अपने बेंचमार्क से काफ़ी पीछे रहे हैं। फिर भी एसेट प्राइसिंग में मशीन लर्निंग के लिए अकादमिक प्रमाण पहले से कहीं ज़्यादा मज़बूत हैं। Gu, Kelly, और Xiu (2020) ने प्रदर्शित किया कि न्यूरल नेटवर्क 0.40% के आउट-ऑफ-सैंपल R-squared के साथ व्यक्तिगत स्टॉक रिटर्न का पूर्वानुमान लगा सकते हैं और 1.8 से अधिक शार्प रेशियो वाले लॉन्ग-शॉर्ट पोर्टफोलियो बना सकते हैं। Kelly, Malamud, और Zhou (2024) ने दिखाया कि मॉडल जटिलता, सामान्यीकरण की दुश्मन होने के बजाय, वास्तव में भविष्यवाणियों में सुधार कर सकती है जब सिग्नल वातावरण में कई कमज़ोर प्रेडिक्टर्स होते हैं।

इन दो वास्तविकताओं में सामंजस्य कैसे बैठाएं? उत्तर इसमें नहीं है कि मशीन लर्निंग निवेश के लिए काम करती है या नहीं — प्रमाण कहते हैं कि यह कर सकती है — बल्कि इस खाई में है कि ML वास्तविक सिग्नल पकड़ती है, यह जानने और बिना शोर में ओवरफिटिंग किए ऐसा करने वाली प्रणाली बनाने के बीच। यही भेद आधुनिक क्वांटिटेटिव फाइनेंस की केंद्रीय चुनौती है।

ML के लिए प्रमाण सबसे मज़बूत कहां हैं

रिटर्न भविष्यवाणी में मशीन लर्निंग का मामला एक विशिष्ट अनुभवजन्य निष्कर्ष पर टिका है: स्टॉक रिटर्न सैकड़ों विशेषताओं के बीच नॉनलीनियर इंटरैक्शन द्वारा संचालित होते हैं, और ये इंटरैक्शन बाज़ार की स्थितियों के साथ बदलते रहते हैं। पारंपरिक लीनियर फैक्टर मॉडल — CAPM से लेकर Fama-French फाइव-फैक्टर मॉडल तक — प्रत्येक प्रेडिक्टर को स्वतंत्र रूप से मानते हैं और स्थिर गुणांक अनुमानित करते हैं। वे प्रथम-क्रम प्रभावों को पकड़ते हैं लेकिन उस सशर्त संरचना को चूक जाते हैं जिसमें अतिरिक्त भविष्यसूचक सामग्री होती है।

Gu, Kelly, और Xiu ने 1957 से 2016 तक पूरे CRSP यूनिवर्स पर 900+ फर्म-स्तरीय और मैक्रोइकोनॉमिक प्रेडिक्टर्स का उपयोग करके हर प्रमुख ML पद्धति का परीक्षण किया। उनके तीन-परत न्यूरल नेटवर्क ने सबसे अधिक आउट-ऑफ-सैंपल R-squared हासिल किया और ऐसे लॉन्ग-शॉर्ट पोर्टफोलियो बनाए जिनका जोखिम-समायोजित प्रदर्शन सर्वश्रेष्ठ लीनियर विकल्पों से लगभग दोगुना था। इस लाभ का स्रोत विदेशी अल्फा नहीं बल्कि सशर्त फैक्टर इंटरैक्शन थे: मोमेंटम उच्च-अस्थिरता शासन में शांत बाज़ारों की तुलना में अलग व्यवहार करता है, वैल्यू की भविष्यसूचक शक्ति व्यापार चक्र के साथ उतार-चढ़ाव करती है, और लिक्विडिटी साइज़ के साथ ऐसे तरीकों से इंटरैक्ट करती है जो कोई भी स्थिर-गुणांक मॉडल प्रस्तुत नहीं कर सकता।

इस निष्कर्ष की पुष्टि स्वतंत्र शोध से हुई है। Israel, Kelly, और Moskowitz (2020) ने पुष्टि की कि ML पद्धतियां मुख्य रूप से नॉनलीनियर इंटरैक्शन को मॉडल करने की अपनी क्षमता के माध्यम से मूल्य जोड़ती हैं, न कि पूरी तरह से नए प्रेडिक्टर्स खोजकर। सबसे महत्वपूर्ण इनपुट — मोमेंटम, वैल्यू, साइज़, प्रॉफिटेबिलिटी — वही हैं जिन्हें पारंपरिक फैक्टर इन्वेस्टिंग ने दशकों से पहचाना है। मशीन लर्निंग का योगदान नए वेरिएबल्स खोजने में नहीं बल्कि मौजूदा वेरिएबल्स के सशर्त इंटरैक्शन को मॉडल करने में है।

फाइनेंशियल ML में ओवरफिटिंग की समस्या

अगर सिग्नल वास्तविक है, तो अधिकांश ML फंड क्यों विफल होते हैं? उत्तर यह है कि वित्तीय भविष्यवाणी मशीन लर्निंग के लिए एक गहरा प्रतिकूल वातावरण है, और जो उपकरण इमेज क्लासिफिकेशन, नेचुरल लैंग्वेज प्रोसेसिंग और प्रोटीन फोल्डिंग पर शानदार ढंग से काम करते हैं, वे रिटर्न पर लागू होने पर गुणात्मक रूप से भिन्न चुनौती का सामना करते हैं।

सूक्ष्म सिग्नल, विशाल शोर

0.40% का आउट-ऑफ-सैंपल R-squared का अर्थ है कि व्यक्तिगत स्टॉक रिटर्न भिन्नता का 99.6% अप्रत्याशित शोर है। कंप्यूटर विज़न में, एक अच्छी तरह से प्रशिक्षित मॉडल 95%+ सटीकता के साथ छवियों को वर्गीकृत करता है। नेचुरल लैंग्वेज प्रोसेसिंग में, बड़े भाषा मॉडल कई बेंचमार्क पर मानव-स्तरीय प्रदर्शन प्राप्त करते हैं। वित्त में, साहित्य का सर्वश्रेष्ठ मॉडल रिटर्न भिन्नता का आधा प्रतिशत से भी कम समझाता है। यह असाधारण रूप से कम सिग्नल-टू-नॉइज़ अनुपात का मतलब है कि पर्याप्त क्षमता वाला कोई भी मॉडल शोर में पैटर्न ढूंढ लेगा जब तक कि इसे रोकने के लिए असाधारण सावधानी न बरती जाए।

अस्थिरता (Non-Stationarity)

वित्तीय बाज़ार गैर-स्थिर हैं: डेटा-जनरेटिंग प्रक्रिया समय के साथ बदलती है। अस्थिरता शासन बदलते हैं, संकटों के दौरान सहसंबंध टूट जाते हैं, नियामक परिवर्तन बाज़ार माइक्रोस्ट्रक्चर को बदल देते हैं, और अन्य प्रतिभागियों की रणनीतियां देखे गए पैटर्न के जवाब में विकसित होती हैं। 2010-2020 डेटा पर प्रशिक्षित मॉडल 2025 में मूल रूप से भिन्न बाज़ार का सामना करता है। मानक ML अभ्यास मानता है कि ट्रेनिंग और टेस्ट वितरण एक ही प्रक्रिया से खींचे गए हैं — एक ऐसी धारणा जो वित्त में नियमित रूप से उल्लंघित होती है।

प्रतिकूल गतिशीलता

प्राकृतिक घटनाओं के विपरीत, वित्तीय बाज़ारों में ऐसे प्रतिभागी होते हैं जो सक्रिय रूप से आपकी भविष्यवाणियों के विरुद्ध प्रतिस्पर्धा करते हैं। जब कोई लाभदायक ML सिग्नल व्यापक रूप से ज्ञात हो जाता है, तो अन्य ट्रेडर्स इसका शोषण करते हैं, भीड़ के कारण लेनदेन लागत बढ़ती है, और सिग्नल क्षीण हो जाता है। McLean और Pontiff (2016) ने प्रलेखित किया कि प्रकाशित अकादमिक एनोमलीज़ शोध सार्वजनिक होने पर अपने रिटर्न प्रीमियम का लगभग एक चौथाई खो देती हैं, बाद के डेटा माइनिंग से अतिरिक्त क्षय होता है। बैकटेस्टिंग के जोखिम सीधे ML क्षेत्र में विस्तारित होते हैं: एक मॉडल जो ऐतिहासिक डेटा में पैटर्न का पता लगाता है, वह ठीक उसी प्रकार के सिग्नल का पता लगा रहा हो सकता है जो लाइव बाज़ारों में सबसे तेज़ी से क्षीण होता है।

क्रॉस-वैलिडेशन की विफलताएं

शायद तकनीकी रूप से सबसे हानिकारक मुद्दा यह है कि मानक क्रॉस-वैलिडेशन — ML मॉडल मूल्यांकन की आधारशिला — सीरियल कोरिलेशन की उपस्थिति में विफल हो जाता है। वित्तीय समय श्रृंखलाएं ऑटोकोरिलेटेड हैं: आज का रिटर्न कल के बारे में जानकारी रखता है। मानक k-fold क्रॉस-वैलिडेशन डेटा को ट्रेनिंग और वैलिडेशन सेट में यादृच्छिक रूप से शफल करता है, जिसका अर्थ है कि ट्रेनिंग अवलोकन जो वैलिडेशन अवलोकनों के समयानुसार निकट हैं, मॉडल मूल्यांकन में भविष्य-दर्शी जानकारी लीक करते हैं। k-fold के तहत अच्छी तरह सामान्यीकृत दिखने वाला मॉडल वास्तविक आउट-ऑफ-सैंपल सिग्नल के बजाय केवल अस्थायी निकटता का शोषण कर रहा हो सकता है।

López de Prado (2018) ने इसे अधिकांश ML फंडों की विफलता के दस कारणों में शामिल किया, तर्क देते हुए कि वित्त उद्योग वित्तीय और गैर-वित्तीय भविष्यवाणी समस्याओं के बीच संरचनात्मक अंतरों को ध्यान में रखे बिना प्रौद्योगिकी कंपनियों से ML तकनीकों को पूरी तरह आयात करता है। समाधान — शुद्ध और प्रतिबंधित क्रॉस-वैलिडेशन, जहां वैलिडेशन सेट के निकट के अवलोकनों को ट्रेनिंग से हटा दिया जाता है — अवधारणात्मक रूप से सरल है लेकिन व्यवहार में शायद ही कभी लागू किया जाता है।

अनुशासित ML अभ्यास कैसा दिखता है

विफल ML फंडों और अकादमिक प्रमाणों के बीच का अंतर बड़े पैमाने पर कार्यप्रणाली का अंतर है। जो प्रैक्टिशनर्स निरंतर ML-व्युत्पन्न अल्फा प्रदान करते हैं, वे एक सामान्य अनुशासन साझा करते हैं जो उन्हें ओवरफिट करने वाले बहुमत से अलग करता है।

शुद्ध वॉक-फॉरवर्ड वैलिडेशन

एकल होल्ड-आउट टेस्ट सेट पर मॉडल प्रदर्शन का मूल्यांकन करने के बजाय, अनुशासित प्रैक्टिशनर्स रोलिंग वॉक-फॉरवर्ड वैलिडेशन का उपयोग करते हैं। मॉडल को समय t तक के डेटा पर प्रशिक्षित किया जाता है, t+1 से t+k तक के डेटा पर परीक्षण किया जाता है, फिर विंडो आगे बढ़ती है। महत्वपूर्ण बात यह है कि ऑटोकोरिलेटेड अवलोकनों से सूचना रिसाव को रोकने के लिए ट्रेनिंग और टेस्ट अवधि के बीच एक बफर अवधि (प्रतिबंध) डाली जाती है। Arnott, Harvey, और Markowitz (2019) ने इसे विशेष रूप से ML युग के लिए डिज़ाइन किए गए बैकटेस्टिंग प्रोटोकॉल के रूप में औपचारिक बनाया, यह प्रदर्शित करते हुए कि मानक ट्रेन-टेस्ट विभाजन व्यवस्थित रूप से प्रदर्शन को बढ़ा-चढ़ाकर दर्शाते हैं।

आर्थिक प्रायर्स रेग्युलराइज़ेशन के रूप में

वित्त में सबसे सफल ML कार्यान्वयन समस्या को ब्लैक बॉक्स के रूप में नहीं मानते। वे आर्थिक संरचना को इंडक्टिव बायस के रूप में शामिल करते हैं: कच्चे रिटर्न के बजाय फैक्टर मॉडल अवशेषों को लक्ष्य के रूप में उपयोग करना, नेटवर्क आर्किटेक्चर को ज्ञात जोखिम संरचनाओं का सम्मान करने के लिए बाधित करना, और ऐसी भविष्यवाणियों को दंडित करना जिनके लिए अविश्वसनीय टर्नओवर की आवश्यकता होती है। यह दृष्टिकोण ML को वित्तीय सिद्धांत के प्रतिस्थापन के बजाय उस नॉनलीनियर अवशेष को पकड़ने के उपकरण के रूप में मानता है जो सिद्धांत चूक जाता है।

Israel, Kelly, और Moskowitz ने इस बात पर ज़ोर दिया कि वित्त में ML मॉडलों को "आर्थिक सिद्धांत द्वारा निर्देशित होना चाहिए, उसे प्रतिस्थापित नहीं करना चाहिए।" उनके प्रयोगों ने दिखाया कि फैक्टर संरचना द्वारा बाधित ML पद्धतियां आउट-ऑफ-सैंपल परीक्षणों में अबाधित मॉडलों से बेहतर प्रदर्शन करती हैं — एक निष्कर्ष जो इस भोली धारणा का सीधा खंडन करता है कि अधिक लचीलापन हमेशा बेहतर होता है।

यथार्थवादी लागत मॉडलिंग

ML-पहचाने गए अल्फा का एक बड़ा हिस्सा स्मॉल-कैप और अतरल प्रतिभूतियों में रहता है जहां निष्पादन लागत सबसे अधिक होती है। अकादमिक साहित्य आमतौर पर लागत-पूर्व रिटर्न रिपोर्ट करता है। जब यथार्थवादी लेनदेन लागत लागू की जाती है — बाज़ार प्रभाव को शामिल करते हुए जो औसत दैनिक वॉल्यूम के सापेक्ष ट्रेड साइज़ के साथ बढ़ता है — स्मॉल-कैप ML अल्फा का अधिकांश भाग विलुप्त हो जाता है। अनुशासित प्रैक्टिशनर्स लागत-पश्चात प्रदर्शन का मूल्यांकन करते हैं और कार्यान्वयन योग्य रणनीतियों के बदले कम सकल अल्फा स्वीकार करते हुए पोर्टफोलियो टर्नओवर बाधाओं के लिए स्पष्ट रूप से अनुकूलन करते हैं।

मल्टीपल टेस्टिंग सुधार

Harvey और Liu (2021) ने प्रदर्शित किया कि कई स्पष्ट रूप से महत्वपूर्ण ML सिग्नल "भाग्यशाली फैक्टर" हैं — व्यापक स्पेसिफिकेशन खोज की कलाकृतियां। जब एक शोधकर्ता सैकड़ों मॉडल कॉन्फ़िगरेशन (नेटवर्क गहराई, लर्निंग रेट, फीचर सबसेट, ट्रेनिंग विंडो) आज़माता है और केवल सर्वश्रेष्ठ परिणाम रिपोर्ट करता है, तो झूठा महत्वपूर्ण सिग्नल पाने की संभावना नाटकीय रूप से बढ़ जाती है। Deflated Sharpe Ratio और संबंधित सुधार मूल्यांकित कुल कॉन्फ़िगरेशन की संख्या के लिए समायोजन करते हैं, और अनुशासित प्रैक्टिशनर्स अपने मॉडल की भविष्यसूचक शक्ति घोषित करने से पहले ये समायोजन लागू करते हैं।

Bailey, Borwein, López de Prado, और Zhu (2017) ने इस समस्या को सटीक रूप से मापा, यह दिखाते हुए कि परीक्षित रणनीति संस्करणों की संख्या के साथ बैकटेस्ट ओवरफिटिंग की संभावना तेज़ी से बढ़ती है। सैकड़ों कॉन्फ़िगरेशन का मूल्यांकन करने वाली एक विशिष्ट शोध पाइपलाइन के लिए, सर्वश्रेष्ठ-प्रदर्शन करने वाले मॉडल के वास्तव में सकारात्मक अपेक्षित रिटर्न होने की संभावना 50% से नीचे गिर सकती है — भले ही इन-सैंपल प्रदर्शन असाधारण दिखे।

जटिलता का विरोधाभास

हाल के ML शोध में सबसे प्रतिकूल निष्कर्षों में से एक यह है कि अधिक जटिल मॉडल क्रॉस-सेक्शनल रिटर्न भविष्यवाणी के विशिष्ट क्षेत्र में बेहतर सामान्यीकरण कर सकते हैं, बदतर नहीं। Kelly, Malamud, और Zhou ने प्रदर्शित किया कि ओवरपैरामीटराइज़्ड न्यूरल नेटवर्क — जिनमें ट्रेनिंग अवलोकनों से कहीं अधिक पैरामीटर होते हैं — मितव्ययी मॉडलों से बेहतर प्रदर्शन करते हैं क्योंकि वे अंतर्निहित रेग्युलराइज़ेशन तंत्र के रूप में कार्य करते हैं। ग्रेडिएंट डिसेंट द्वारा पाया गया न्यूनतम-मानक समाधान कई पैरामीटरों में अनुमान जोखिम फैलाता है, किसी भी एकल प्रेडिक्टर को प्रभुत्व करने से रोकता है और मॉडल को सैकड़ों विशेषताओं में कमज़ोर लेकिन वास्तविक सिग्नलों को एकत्र करने की अनुमति देता है।

यह "डबल डिसेंट" घटना का अर्थ है कि मॉडलों को सरल रखने की शास्त्रीय सलाह वास्तव में इक्विटी रिटर्न भविष्यवाणी की विशिष्ट सेटिंग में प्रदर्शन को नुकसान पहुंचा सकती है, जहां सिग्नल वास्तव में कई कमज़ोर प्रेडिक्टर्स में बिखरा हुआ है। हालांकि, यह परिणाम केवल विशिष्ट शर्तों के तहत ही लागू होता है: मॉडल को उचित रेग्युलराइज़ेशन (स्पष्ट या अंतर्निहित) के साथ प्रशिक्षित किया जाना चाहिए, सख्त आउट-ऑफ-सैंपल प्रोटोकॉल के साथ मान्य किया जाना चाहिए, और यथार्थवादी लागत धारणाओं के साथ मूल्यांकन किया जाना चाहिए। जटिलता एक गुण है केवल तब जब उसके साथ वह अनुशासन हो जो इसे ओवरफिट करने का लाइसेंस बनने से रोके।

व्यावहारिक निहितार्थ सूक्ष्म है। ओवरफिटिंग का शास्त्रीय भय गलत नहीं है — यह केवल अपूर्ण है। वित्त में, खतरा जटिलता अपने आप में नहीं बल्कि अनुशासनहीन जटिलता है: ऐसे मॉडल जो बड़े और लचीले हैं लेकिन उचित वैलिडेशन, आर्थिक प्रायर्स और लागत-सचेत मूल्यांकन की सुरक्षा रेलिंग के बिना।

ML क्वांट रणनीतियों का मूल्यांकन कैसे करें

ML-संचालित रणनीतियों में आवंटन पर विचार करने वाले निवेशकों के लिए, शोध एक ठोस मूल्यांकन ढांचा सुझाता है।

पहला, वैलिडेशन कार्यप्रणाली को समझें। किसी भी विश्वसनीय ML रणनीति को प्रतिबंध अवधि के साथ शुद्ध वॉक-फॉरवर्ड वैलिडेशन का उपयोग करना चाहिए। यदि प्रदर्शन रिकॉर्ड एक साधारण 80/20 ट्रेन-टेस्ट विभाजन पर आधारित है, तो रिपोर्ट किए गए आंकड़े लगभग निश्चित रूप से बढ़े-चढ़े हैं। विशेष रूप से पूछें कि ट्रेनिंग डेटा में सीरियल कोरिलेशन को कैसे संभाला जाता है।

दूसरा, लागत-पश्चात प्रदर्शन की मांग करें। सकल शार्प रेशियो उन रणनीतियों के लिए अर्थहीन हैं जो अतरल प्रतिभूतियों में बार-बार ट्रेड करती हैं। प्रासंगिक मेट्रिक यथार्थवादी बिड-आस्क स्प्रेड, वास्तविक पोर्टफोलियो आकार के अनुसार मापा गया मार्केट इम्पैक्ट अनुमान, और शॉर्ट पोज़ीशन के लिए उधार लागत काटने के बाद शुद्ध अल्फा है। 1.8 का सकल शार्प रेशियो शुद्ध रूप से 0.6 हो सकता है — अभी भी सकारात्मक, लेकिन मूल रूप से भिन्न प्रस्ताव।

तीसरा, शासन मज़बूती की जांच करें। एक मॉडल जो ट्रेंडिंग बाज़ारों में शानदार प्रदर्शन करता है लेकिन अस्थिरता स्पाइक के दौरान ध्वस्त हो जाता है, संभवतः एक ऐसे मोमेंटम सिग्नल को पकड़ रहा है जो तनाव अवधि में उलट जाता है। वास्तविक ML अल्फा को विभिन्न बाज़ार वातावरणों में बाइनरी ऑन/ऑफ व्यवहार प्रदर्शित करने के बजाय धीरे-धीरे क्षीण होना चाहिए। अस्थिरता शासन, बाज़ार दिशा और लिक्विडिटी स्थितियों के अनुसार प्रदर्शन एट्रिब्यूशन की मांग करें।

चौथा, मॉडल व्याख्यात्मकता के बारे में पूछें। हालांकि मॉडल के काम करने के लिए व्याख्यात्मकता आवश्यक नहीं है, एक टीम जो यह नहीं समझा सकती कि उनका मॉडल क्या पकड़ रहा है — कम से कम उच्च स्तर पर — शायद यह नहीं समझती कि यह कब और क्यों विफल होगा। सर्वश्रेष्ठ ML प्रैक्टिशनर्स उस आर्थिक तंत्र को स्पष्ट कर सकते हैं जिसका उनका मॉडल शोषण करता है: सशर्त फैक्टर इंटरैक्शन, समय-परिवर्तनशील जोखिम प्रीमिया, या माइक्रोस्ट्रक्चर-संचालित सिग्नल। बिना किसी आर्थिक कथा वाला शुद्ध ब्लैक बॉक्स अधिक संदेह का पात्र है।

आगे का रास्ता

मशीन लर्निंग न तो निवेश में मानवीय निर्णय का अंत है और न ही कोई गारंटीशुदा बढ़त। अकादमिक प्रमाण स्थापित करते हैं कि ML पद्धतियां वास्तव में क्रॉस-सेक्शनल रिटर्न में भविष्यसूचक सिग्नल पकड़ती हैं — ऐसा सिग्नल जो विदेशी नए वेरिएबल्स के बजाय सशर्त, नॉनलीनियर फैक्टर इंटरैक्शन से आता है। लेकिन इस अकादमिक निष्कर्ष और एक लाभदायक, टिकाऊ निवेश रणनीति के बीच की दूरी बहुत बड़ी है। इसके लिए गैर-स्थिर, क्रमिक रूप से सहसंबंधित, प्रतिकूल डेटा के लिए डिज़ाइन की गई वैलिडेशन पद्धतियों की आवश्यकता है; ऐसे आर्थिक प्रायर्स जो मॉडल को शोर में फिट होने से रोकें; यथार्थवादी लागत मॉडलिंग जो ML अल्फा में अतरलता प्रीमियम को स्वीकार करे; और किसी भी ML शोध पाइपलाइन में निहित मल्टीपल टेस्टिंग के लिए ईमानदार लेखांकन।

जो फंड इस कठिन परीक्षा से बचते हैं वे सिलिकॉन वैली डेटा साइंस दुकानों से कम और पारंपरिक सिस्टमैटिक क्वांट फर्मों से अधिक मिलते-जुलते दिखते हैं जिन्होंने ML को कई उपकरणों में से एक के रूप में शामिल किया है। वे सशर्त फैक्टर एक्सपोज़र को मॉडल करने के लिए न्यूरल नेटवर्क का उपयोग करते हैं, लेकिन वे अपने मॉडलों को आर्थिक सिद्धांत में आधारित रखते हैं। वे वहां जटिलता अपनाते हैं जहां प्रमाण इसका समर्थन करते हैं, लेकिन वे ऐसी कठोरता से मान्य करते हैं जिसे वित्त के बाहर अधिकांश ML प्रैक्टिशनर्स अत्यधिक मानेंगे। वे स्वीकार करते हैं कि 0.40% R-squared एक वास्तविक उपलब्धि है, गोलाई की त्रुटि नहीं, और वे उस पतली बढ़त से अत्यधिक ट्रेडिंग के माध्यम से नष्ट किए बिना मूल्य निकालने के लिए बुनियादी ढांचा बनाते हैं।

सवाल यह नहीं है कि मशीन लर्निंग क्वांट निवेश में काम करती है या नहीं। प्रमाण कहते हैं कि करती है। सवाल यह है कि क्या कार्यान्वयन 0.40% सिग्नल को 99.6% शोर से अलग करने के लिए पर्याप्त अनुशासित है — और क्या वह अनुशासन बाज़ारों के विकास और प्रतिस्पर्धा के तीव्र होने पर भी बनाए रखा जा सकता है।

यह लेख निवेश में ML अनुप्रयोगों पर अकादमिक शोध की जांच करता है। यह किसी भी चर्चित रणनीति में निवेश की सिफारिश नहीं है। मॉडल किए गए प्रदर्शन मेट्रिक्स विशिष्ट अकादमिक अध्ययन शर्तों को दर्शाते हैं और अधिकांश व्यक्तिगत निवेशकों के लिए दोहराने योग्य नहीं हैं।

Written by Sam · Reviewed by Sam

यह लेख उद्धृत प्राथमिक साहित्य पर आधारित है और सटीकता तथा उचित श्रेय के लिए हमारी संपादकीय टीम द्वारा समीक्षित है। संपादकीय नीति.

संदर्भ

  1. Gu, S., Kelly, B., & Xiu, D. (2020). Empirical Asset Pricing via Machine Learning. The Review of Financial Studies, 33(5), 2223-2273. https://doi.org/10.1093/rfs/hhaa009

  2. Kelly, B., Malamud, S., & Zhou, K. (2024). The Virtue of Complexity in Return Prediction. The Journal of Finance, 79(1), 459-503. https://doi.org/10.1111/jofi.13298

  3. López de Prado, M. (2018). The 10 Reasons Most Machine Learning Funds Fail. The Journal of Portfolio Management, 44(6), 120-133. https://doi.org/10.3905/jpm.2018.44.6.120

  4. Israel, R., Kelly, B., & Moskowitz, T. (2020). Can Machines 'Learn' Finance? Journal of Investment Management, 18(2), 23-36. https://ssrn.com/abstract=3624052

  5. Harvey, C. R., & Liu, Y. (2021). Lucky Factors. Journal of Financial Economics, 141(2), 413-435. https://doi.org/10.1016/j.jfineco.2021.04.014

  6. Arnott, R. D., Harvey, C. R., & Markowitz, H. (2019). A Backtesting Protocol in the Era of Machine Learning. The Journal of Financial Data Science, 1(1), 64-74. https://doi.org/10.3905/jfds.2019.1.1.064

  7. McLean, R. D., & Pontiff, J. (2016). Does Academic Research Destroy Stock Return Predictability? The Journal of Finance, 71(1), 5-32. https://doi.org/10.1111/jofi.12365

  8. Bailey, D. H., Borwein, J. M., López de Prado, M., & Zhu, Q. J. (2017). The Probability of Backtest Overfitting. Journal of Computational Finance, 20(4), 39-69. https://doi.org/10.21314/JCF.2017.332

इस लेख का योगदान

ML-ब्रांडेड क्वांट फंड 2025-2026 में रिकॉर्ड पूंजी आकर्षित कर रहे हैं, ऐसे में वास्तविक भविष्यवाणी संकेत और विस्तृत ओवरफिटिंग के बीच का अंतर पहले से कहीं अधिक महत्वपूर्ण हो गया है। यह लेख उन शैक्षणिक साक्ष्यों को संश्लेषित करता है जहां मशीन लर्निंग वास्तव में रिटर्न भविष्यवाणी को आगे बढ़ाती है और जहां यह केवल शोर को परिष्कार के रूप में पुनर्पैक करती है।

साक्ष्य मूल्यांकन

  • 5/5Neural networks achieve the highest out-of-sample R-squared (0.40%) for individual US stock returns across a 60-year sample, generating long-short portfolio Sharpe ratios above 1.8, but these results assume institutional-scale execution and gross-of-cost measurement.
  • 4/5An estimated 85-90% of ML-driven quantitative funds fail to deliver sustained alpha, with overfitting to in-sample patterns, inadequate cross-validation, and unrealistic transaction cost assumptions cited as the primary failure modes.
  • 4/5Proper walk-forward validation with purged and embargoed cross-validation can reduce backtest overfitting rates by 60-80% compared to standard k-fold approaches, as financial time series violate the independence assumptions of conventional ML evaluation frameworks.

अक्सर पूछे जाने वाले प्रश्न

अधिकांश मशीन लर्निंग हेज फंड विफल क्यों होते हैं?
López de Prado (2018) ने दस व्यवस्थित विफलता मोड की पहचान की, जिनमें सबसे प्रचलित हैं इन-सैंपल नॉइज़ पर ओवरफिटिंग, वित्तीय टाइम सीरीज़ की सीरियल निर्भरता को अनदेखा करने वाली मानक क्रॉस-वैलिडेशन तकनीकों का अनुप्रयोग, और यथार्थवादी लेनदेन लागतों की उपेक्षा। कई ML फंड वित्तीय भविष्यवाणी को सामान्य सुपरवाइज़्ड लर्निंग समस्या मानते हैं, वित्तीय बाज़ारों के विशिष्ट कम सिग्नल-टू-नॉइज़ अनुपात, गैर-स्थिरता और प्रतिकूल गतिशीलता को अनदेखा करते हैं।
क्या मशीन लर्निंग वास्तव में स्टॉक रिटर्न की भविष्यवाणी कर सकती है?
हां, लेकिन महत्वपूर्ण शर्तों के साथ। Gu, Kelly और Xiu (2020) ने प्रदर्शित किया कि न्यूरल नेटवर्क अमेरिकी स्टॉक रिटर्न के लिए सार्थक आउट-ऑफ-सैंपल भविष्यवाणी शक्ति प्राप्त करते हैं, पारंपरिक मॉडल द्वारा छूटने वाली गैर-रैखिक फैक्टर अंतःक्रियाओं को पकड़ते हैं। हालांकि, भविष्यवाणी R-स्क्वायर्ड केवल 0.40% है — छोटा लेकिन संस्थागत स्तर पर आर्थिक रूप से महत्वपूर्ण।

केवल शैक्षिक।