QD Research EngineAI-Synthesised

एसेट प्राइसिंग में मशीन लर्निंग: वास्तव में क्या काम करता है

मॉडल और फ्रेमवर्कपेपर समीक्षा
2026-03-11 · 14 min

एक ऐतिहासिक अध्ययन ने 60 वर्षों में 30,000+ अमेरिकी शेयरों पर हर प्रमुख ML विधि का परीक्षण किया। न्यूरल नेटवर्क ने रैखिक मॉडलों द्वारा पूरी तरह से चूक गए गैर-रैखिक फैक्टर इंटरैक्शन को पकड़कर 1.8 से अधिक शार्प रेशियो हासिल करते हुए सबसे बेहतर प्रदर्शन किया।

Machine LearningAsset PricingRandom ForestsNeural NetworksFactor Zoo
स्रोत: Gu, Kelly & Xiu (2020), Review of Financial Studies

खुदरा निवेशकों के लिए व्यावहारिक उपयोग

जबकि खुदरा निवेशक न्यूरल नेटवर्क-आधारित ट्रेडिंग रणनीतियों की नकल नहीं कर सकते, ये निष्कर्ष बताते हैं कि सरल फैक्टर ETF अक्सर अपने बैकटेस्ट से कम प्रदर्शन क्यों करते हैं। वास्तविक रिटर्न प्रीमियम गतिशील, सशर्त फैक्टर एक्सपोज़र से आने की प्रवृत्ति रखता है जो बाज़ार की स्थितियों के अनुसार समायोजित होता है। क्वांट फंड या स्मार्ट बीटा उत्पादों का मूल्यांकन करते समय, बदलती बाज़ार स्थितियों के अनुसार अनुकूलित होने वाली रणनीतियां स्थिर नियम लागू करने वाली रणनीतियों से बेहतर प्रदर्शन करने की संभावना अधिक रखती हैं।

संपादकीय टिप्पणी

जैसे-जैसे AI इक्विटी बाज़ारों और उनके विश्लेषण उपकरणों दोनों को नया रूप दे रहा है, गु, केली और शिउ का पेपर एसेट प्राइसिंग में मशीन लर्निंग के लिए निर्णायक बेंचमार्क बन गया है। फैक्टर भीड़ बढ़ती चिंता है और रैखिक फैक्टर मॉडल पर प्रश्न उठ रहे हैं, ऐसे में गैर-रैखिक विधियां कब और क्यों बेहतर प्रदर्शन करती हैं, यह समझना आवश्यक है।

30,000 स्टॉक, 900 प्रेडिक्टर, एक सवाल

1957 से 2016 के बीच, मैक्रोइकोनॉमिक संकेतकों और फर्म विशेषताओं पर प्रशिक्षित एक न्यूरल नेटवर्क ने व्यक्तिगत अमेरिकी स्टॉक रिटर्न के लिए 0.40% का आउट-ऑफ-सैंपल R-स्क्वेयर हासिल किया। यह संख्या छोटी लगती है, लेकिन 30,000 से अधिक स्टॉक के ब्रह्मांड में, रिटर्न भविष्यवाणी में एक छोटा सा भी लाभ आर्थिक रूप से महत्वपूर्ण पोर्टफोलियो लाभ में बदल जाता है। इन न्यूरल नेटवर्क भविष्यवाणियों पर बनाए गए लॉन्ग-शॉर्ट पोर्टफोलियो ने 1.8 से अधिक का शार्प रेशियो अर्जित किया — जो उसी अवधि में सर्वश्रेष्ठ रैखिक मॉडलों द्वारा हासिल किए गए मूल्य से दोगुने से अधिक है।

ये आधुनिक अनुभवजन्य वित्त में सबसे अधिक उद्धृत पत्रों में से एक — "Empirical Asset Pricing via Machine Learning" — के प्रमुख निष्कर्ष हैं। यह पत्र Sheng Gu, Bryan Kelly और Dacheng Xiu द्वारा लिखा गया और 2020 में Review of Financial Studies में प्रकाशित हुआ (Gu, Kelly & Xiu, 2020)। यह पत्र वित्त की मूलभूत समस्या — स्टॉक रिटर्न की भविष्यवाणी — पर लागू हर प्रमुख मशीन लर्निंग विधि के बीच एक व्यवस्थित प्रतिस्पर्धा है, और इसके निष्कर्ष कुशल बाजार शिविर और फैक्टर ज़ू संशयवादियों दोनों को चुनौती देते हैं।

समस्या: बहुत सारे फैक्टर, अपर्याप्त सिग्नल

एसेट प्राइसिंग में एक डेटा समस्या है। पिछले तीन दशकों में, शोधकर्ताओं ने सैकड़ों ऐसे वेरिएबल प्रस्तावित किए हैं जो कथित रूप से स्टॉक रिटर्न की भविष्यवाणी करते हैं। बुक-टू-मार्केट, मोमेंटम, प्रॉफिटेबिलिटी, इन्वेस्टमेंट, एक्रुअल्स, शेयर इश्यूएंस, इडियोसिंक्रेटिक वोलैटिलिटी — यह सूची अब 400 से अधिक प्रकाशित विसंगतियों से आगे निकल गई है। Harvey, Liu और Zhu ने अपने 2016 के पत्र में इस विस्फोट का दस्तावेजीकरण किया, यह तर्क देते हुए कि इनमें से अधिकांश "खोजें" डेटा माइनिंग द्वारा प्रवर्धित सांख्यिकीय शोर हैं (Harvey, Liu & Zhu, 2016)।

इस समस्या के लिए पारंपरिक दृष्टिकोण रैखिक है। कुछ फैक्टर चुनें, रिग्रेशन चलाएं, t-स्टैटिस्टिक्स जांचें। फामा-फ्रेंच पांच-फैक्टर मॉडल पांच वेरिएबल का उपयोग करता है। सबसे महत्वाकांक्षी रैखिक मॉडल भी शायद ही कभी कुछ दर्जन से अधिक का उपयोग करते हैं। कारण सरल है: रैखिक रिग्रेशन गंभीर ओवरफिटिंग के बिना सैकड़ों सहसंबद्ध भविष्यवक्ताओं को संभाल नहीं सकता। रैखिक मॉडल में अधिक वेरिएबल जोड़ने से अंततः भविष्यवाणियां बेहतर नहीं, बल्कि बदतर हो जाती हैं।

मशीन लर्निंग इस गणना को बदल देती है। रैंडम फॉरेस्ट, ग्रेडिएंट-बूस्टेड ट्री और न्यूरल नेटवर्क जैसी विधियां विशेष रूप से उच्च-आयामी, शोरयुक्त डेटा से सिग्नल निकालने के लिए डिज़ाइन की गई हैं। वे वेरिएबलों के बीच गैर-रैखिक संबंधों और अंतःक्रियाओं को पकड़ सकती हैं जो रैखिक मॉडल पूरी तरह से चूक जाते हैं। Gu, Kelly और Xiu ने जो प्रश्न पूछा वह यह था कि क्या ये विधियां, प्रस्तावित सभी स्टॉक भविष्यवक्ताओं के पूर्ण ब्रह्मांड पर लागू होने पर, वास्तव में रिटर्न पूर्वानुमान में सुधार करती हैं।

प्रतिस्पर्धा

पत्र एक व्यापक विधियों का परीक्षण करता है, सभी समान डेटा पर प्रशिक्षित और समान आउट-ऑफ-सैंपल शर्तों के तहत मूल्यांकित। विधियां पारंपरिक अर्थमितीय दृष्टिकोणों से लेकर अत्याधुनिक मशीन लर्निंग तक हैं:

विधिआउट-ऑफ-सैंपल R²मासिक शार्प (L/S)
OLS (सभी प्रेडिक्टर)-1.01%0.60
OLS (3 प्रेडिक्टर)0.16%0.89
Elastic Net0.21%1.12
Random Forest0.23%1.35
Gradient-Boosted Trees0.34%1.51
Neural Network (NN3)0.40%1.80
Neural Network (NN5)0.36%1.71

इन परिणामों से कई पैटर्न उभरते हैं।

पहला, सभी प्रेडिक्टरों के साथ OLS एक आपदा है। नकारात्मक R-स्क्वेयर का अर्थ है कि OLS भविष्यवाणियों का उपयोग करने की तुलना में हर स्टॉक के लिए ऐतिहासिक औसत रिटर्न की भविष्यवाणी करना बेहतर होता। यह पुष्टि करता है कि उच्च आयामों में रैखिक मॉडल ओवरफिट होते हैं।

दूसरा, रेगुलराइज़ेशन बहुत मदद करता है। Elastic Net, जो गुणांकों को सिकोड़ने और वेरिएबल चयन करने वाले पेनल्टी टर्म के साथ रैखिक रिग्रेशन है, नकारात्मक R-स्क्वेयर को सकारात्मक में बदल देता है। लेकिन सुधार जल्दी ही रुक जाता है क्योंकि Elastic Net अभी भी मूल रूप से रैखिक है।

तीसरा, ट्री-आधारित विधियां रैखिक विधियों से बेहतर प्रदर्शन करती हैं। रैंडम फॉरेस्ट और ग्रेडिएंट-बूस्टेड ट्री प्रेडिक्टरों और रिटर्न के बीच गैर-रैखिक संबंधों को पकड़ते हैं, R-स्क्वेयर को ऊपर धकेलते हैं और शार्प रेशियो को 1.3 से ऊपर ले जाते हैं।

चौथा, न्यूरल नेटवर्क जीतता है। तीन-परत न्यूरल नेटवर्क (NN3) सबसे अधिक आउट-ऑफ-सैंपल R-स्क्वेयर और सबसे अधिक शार्प रेशियो प्राप्त करता है। पांच-परत नेटवर्क (NN5) थोड़ा कम है, जो इस अनुप्रयोग में गहराई से घटते प्रतिफल का सुझाव देता है।

न्यूरल नेटवर्क क्या खोजता है

पत्र का सबसे ज्ञानवर्धक योगदान केवल प्रतिस्पर्धा के परिणाम नहीं हैं बल्कि इस बात का विश्लेषण है कि विजेता मॉडल वास्तव में क्या सीखते हैं। वेरिएबल महत्व विश्लेषण नामक तकनीक का उपयोग करते हुए, लेखक प्रत्येक मॉडल की भविष्यवाणियों को विघटित करते हैं ताकि यह पहचाना जा सके कि कौन से इनपुट पूर्वानुमानों को चलाते हैं।

सभी गैर-रैखिक मॉडलों में प्रमुख प्रेडिक्टर मोमेंटम है — लेकिन सरल 12-महीने का मोमेंटम नहीं। न्यूरल नेटवर्क शॉर्ट-टर्म रिवर्सल (1-महीने के रिटर्न), मीडियम-टर्म मोमेंटम (2-12 महीने), और लॉन्ग-टर्म रिवर्सल (13-60 महीने) के बीच जटिल अंतःक्रियाओं की पहचान करता है जो बाजार की स्थितियों के साथ बदलती हैं। उच्च-अस्थिरता वातावरण में, शॉर्ट-टर्म रिवर्सल हावी होता है। शांत बाजारों में, मीडियम-टर्म मोमेंटम प्रभावी होता है।

दूसरी सबसे महत्वपूर्ण श्रेणी लिक्विडिटी और ट्रेडिंग गतिविधि है। शेयर टर्नओवर, बिड-आस्क स्प्रेड, और डॉलर ट्रेडिंग वॉल्यूम जैसे वेरिएबल साइज़ और मोमेंटम के साथ ऐसे तरीकों से अंतःक्रिया करते हैं जो रैखिक मॉडल पकड़ नहीं सकते।

तीसरा प्रमुख निष्कर्ष मैक्रोइकोनॉमिक अंतःक्रियाओं का महत्व है। न्यूरल नेटवर्क सीखता है कि फर्म विशेषताओं की भविष्यवाणी शक्ति व्यापार चक्र के साथ बदलती है। वैल्यू स्टॉक (उच्च बुक-टू-मार्केट) मंदी के दौरान रिटर्न की अधिक मजबूती से भविष्यवाणी करते हैं, जबकि मोमेंटम विस्तार के दौरान बेहतर काम करता है।

फैक्टर ज़ू को वश में करना

Feng, Giglio और Xiu का सहयोगी पत्र इस बात के लिए अतिरिक्त सैद्धांतिक आधार प्रदान करता है कि इस सेटिंग में मशीन लर्निंग क्यों काम करती है (Feng, Giglio & Xiu, 2020)। उनका फ्रेमवर्क एक मूलभूत प्रश्न को संबोधित करता है: 400+ प्रस्तावित फैक्टरों के साथ, आप कैसे निर्धारित करते हैं कि कौन से वास्तव में जोखिम को पकड़ते हैं और कौन से शोर हैं?

पारंपरिक दृष्टिकोण — मौजूदा मॉडलों के विरुद्ध एक-एक करके फैक्टरों का परीक्षण — सांख्यिकीय रूप से दोषपूर्ण है क्योंकि यह बहु-परीक्षण समस्या की उपेक्षा करता है। 150 से अधिक प्रकाशित फैक्टरों पर लागू करने पर, उन्होंने पाया कि अधिकांश अनावश्यक हैं। बहु-परीक्षण और फैक्टरों के बीच सहसंबंधों को उचित रूप से ध्यान में रखने के बाद, केवल मुट्ठी भर फैक्टर ही बचते हैं।

व्यावहारिक निहितार्थ

व्यावहारिक निहितार्थ इस बात पर काफी निर्भर करते हैं कि आप कौन हैं।

संस्थागत निवेशकों और हेज फंडों के लिए, यह पत्र मात्रात्मक रणनीतियों में मशीन लर्निंग की ओर बदलाव को मान्य करता है। आउट-ऑफ-सैंपल लाभ इतने बड़े हैं कि वे कुशलता से ट्रेड कर सकने वाले पोर्टफोलियो के लिए लेनदेन लागतों को सहन कर सकते हैं।

खुदरा निवेशकों के लिए, निहितार्थ अधिक सूक्ष्म हैं। आप इन रणनीतियों की घर पर नकल नहीं कर सकते। हालांकि, निष्कर्षों के अप्रत्यक्ष निहितार्थ हैं। यदि सच्ची रिटर्न-उत्पन्न प्रक्रिया गैर-रैखिक है तो सरल, स्थिर फैक्टर एक्सपोज़र उपलब्ध प्रीमियम का केवल एक अंश ही पकड़ पाएंगे। यह समझाने में मदद करता है कि फैक्टर ETF अक्सर अपने बैकटेस्ट की तुलना में कम प्रदर्शन क्यों करते हैं।

सीमाएं और अनुत्तरित प्रश्न

पत्र की ताकतें इसकी सीमाएं भी हैं। 60 वर्षों का नमूना काल (1957-2016) कई बाजार शासनों को शामिल करता है, जो सामान्यीकरण के लिए अच्छा है। लेकिन सबसे हालिया दशक — लगभग-शून्य ब्याज दरों, अभूतपूर्व केंद्रीय बैंक हस्तक्षेप, और निष्क्रिय निवेश के उदय द्वारा चिह्नित — एक संरचनात्मक विराम का प्रतिनिधित्व कर सकता है।

सावधानीपूर्ण सैंपल-बाहर डिज़ाइन के बावजूद ओवरफिटिंग एक चिंता बनी हुई है। Kelly, Malamud और Zhou (2024) ने एक बाद के पत्र में इस चिंता को संबोधित किया, जिसमें सैद्धांतिक औचित्य प्रदान किया गया कि जटिल मॉडल उच्च-आयामी सेटिंग्स में केवल ओवरफिट करने के बजाय वास्तव में बेहतर प्रदर्शन क्यों कर सकते हैं (Kelly, Malamud & Zhou, 2024)।

लेनदेन लागतों को स्वीकार किया गया है लेकिन पूरी तरह से शामिल नहीं किया गया है। यथार्थवादी लेनदेन लागत समायोजन के बाद, न्यूरल नेटवर्क का सरल विधियों पर लाभ कम होता है, लेकिन गायब नहीं होता।

बड़ी तस्वीर

Gu, Kelly और Xiu का पत्र अनुभवजन्य एसेट प्राइसिंग में एक महत्वपूर्ण मोड़ है। यह प्रदर्शित करता है कि सांख्यिकीय विधि का चुनाव — रैखिक बनाम गैर-रैखिक, सरल बनाम जटिल — भविष्यवक्ताओं के चुनाव जितना ही महत्वपूर्ण है। दशकों तक, एसेट प्राइसिंग अनुसंधान ने उसी रैखिक रिग्रेशन टूलकिट का उपयोग करते हुए नए वेरिएबल खोजने पर ध्यान केंद्रित किया। यह पत्र दिखाता है कि टूलकिट स्वयं ही बाधा थी।

मात्रात्मक रणनीतियों में निवेश करने वाले किसी भी व्यक्ति के लिए — चाहे हेज फंड, स्मार्ट बीटा ETF, या अपने स्वयं के व्यवस्थित दृष्टिकोण के माध्यम से — इस पत्र का केंद्रीय संदेश स्पष्ट है: विधियां डेटा जितनी ही महत्वपूर्ण हैं, और सबसे सरल मॉडल हमेशा सबसे अच्छा मॉडल नहीं होता।

यह लेख केवल शैक्षिक उद्देश्यों के लिए है और निवेश सलाह नहीं है। पिछला प्रदर्शन भविष्य के परिणामों की गारंटी नहीं देता।

यह विश्लेषण Gu, Kelly & Xiu (2020), Review of Financial Studies से QD Research Engine Quant Decoded का स्वचालित अनुसंधान मंचद्वारा संश्लेषित किया गया है और सटीकता के लिए हमारी संपादकीय टीम द्वारा समीक्षा की गई है। हमारी कार्यप्रणाली के बारे में और जानें.

संदर्भ

केवल शैक्षिक।