
कृत्रिम बुद्धिमत्ता (AI) मॉडल, जो इंटरनेट के विशाल पाठ भंडार से दुनिया का ज्ञान प्राप्त करते हैं, क्या वे केवल पैटर्न दोहराते हैं या वास्तविकता की गहरी समझ भी विकसित करते हैं। यह एक ऐसा प्रश्न है जिसने दशकों से वैज्ञानिकों और दार्शनिकों को मोहित किया है। अब, ब्राउन विश्वविद्यालय के शोधकर्ताओं द्वारा किए गए एक नए अध्ययन से पता चला है कि AI भाषा मॉडल में वास्तविक दुनिया की घटनाओं के बीच अंतर करने की एक गणितीय ‘समझ’ होती है – यह पहचानना कि क्या सामान्य है, क्या असंभव है, क्या असंभावित है, या बस क्या बेतुका है।
AI चैटबॉट को जो कुछ भी पता है, वह इंटरनेट से भारी मात्रा में पाठ्य सामग्री को ‘निगलने’ से आता है, जिसमें सभी तथ्य, गलतियाँ, ज्ञान और निरर्थक बातें शामिल होती हैं। इस इनपुट को देखते हुए, यह सवाल उठता है कि क्या AI भाषा मॉडल में वास्तविक दुनिया की ‘समझ’ हो सकती है। जैसा कि यह पता चला है, वे करते हैं – या कम से कम समझ के जैसा कुछ। यह ब्राउन विश्वविद्यालय के शोधकर्ताओं द्वारा किए गए एक नए अध्ययन के अनुसार है, जिसे ब्राजील के रियो डी जनेरियो में इंटरनेशनल कॉन्फ्रेंस ऑन लर्निंग रिप्रेजेंटेशन में प्रस्तुत किया जाएगा।
यह अध्ययन कई AI भाषा मॉडलों के अंदर गहराई से गया, ताकि यह पता लगाया जा सके कि वे घटनाओं और परिदृश्यों के बीच अंतर जानते हैं या नहीं। इन परिदृश्यों में सामान्य बातें, असंभावित स्थितियाँ, असंभव घटनाएँ या पूरी तरह से निरर्थक बातें शामिल थीं।
वास्तविक दुनिया की कार्य-कारण संबंधी बाधाओं को समझना
माइकल लेपोरी, ब्राउन में पीएचडी उम्मीदवार जिन्होंने इस कार्य का नेतृत्व किया, कहते हैं, “यह काम कुछ सबूतों को उजागर करता है कि भाषा मॉडलों ने वास्तविक दुनिया की कार्य-कारण संबंधी बाधाओं को किसी न किसी रूप में कूटबद्ध (encode) किया है।” वे आगे कहते हैं, “इन बाधाओं को कूटबद्ध करने के अलावा, वे ऐसा इस तरह से करते हैं जो इन श्रेणियों के बारे में मानवीय निर्णयों की भविष्यवाणी करता है।” लेपोरी का शोध कंप्यूटर विज्ञान और मानव अनुभूति के चौराहे पर आधारित है। उन्हें कंप्यूटर विज्ञान के प्रोफेसर एली पावलिक और संज्ञानात्मक और मनोवैज्ञानिक विज्ञान के प्रोफेसर थॉमस सेरे द्वारा सलाह दी जाती है, ये दोनों ब्राउन के कार्नी इंस्टीट्यूट फॉर ब्रेन साइंस के संकाय सहयोगी और शोध के सह-लेखक हैं।
अध्ययन के लिए, शोधकर्ताओं ने यह परीक्षण करने के लिए एक प्रयोग डिज़ाइन किया कि भाषा मॉडल विभिन्न संभावनाओं का वर्णन करने वाले वाक्यों की व्याख्या कैसे करते हैं। कुछ कथन सामान्य परिदृश्यों का वर्णन करते हैं: उदाहरण के लिए, “किसी ने बर्फ से एक पेय ठंडा किया।” कुछ परिदृश्य असंभावित या अस्वाभाविक थे: “किसी ने बर्फ से एक पेय ठंडा किया।” कुछ असंभव थे: “किसी ने आग से एक पेय ठंडा किया।” कुछ निरर्थक थे: “किसी ने कल से एक पेय ठंडा किया।”
प्रत्येक इनपुट के लिए, शोधकर्ताओं ने AI मॉडल के अंदर उत्पन्न होने वाली गणितीय अवस्थाओं की जांच की, जिसे ‘मैकेनिकल इंटरप्रिटेबिलिटी’ नामक दृष्टिकोण से जाना जाता है। लेपोरी ने बताया, “मैकेनिकल इंटरप्रिटेबिलिटी को AI सिस्टम के लिए न्यूरोसाइंस के रूप में उचित रूप से वर्णित किया जा सकता है।” “यह रिवर्स-इंजीनियरिंग करना चाहता है कि जब मॉडल किसी विशेष इनपुट के संपर्क में आता है तो क्या कर रहा होता है। आप इसे मशीन के ‘मस्तिष्क अवस्था’ में क्या कूटबद्ध है, उसे समझने के रूप में सोच सकते हैं।”
AI के ‘मस्तिष्क’ में अंतर
विभिन्न श्रेणियों के वाक्यों के जोड़ों – जैसे सामान्य बनाम असंभावित, असंभावित बनाम असंभव – द्वारा उत्पन्न ‘मस्तिष्क अवस्थाओं’ में अंतर की तुलना करके, शोधकर्ता यह समझ सकते थे कि मॉडल आंतरिक रूप से श्रेणियों के बीच कितना और कैसे अंतर करते हैं। यह प्रयोग कई अलग-अलग ओपन-सोर्स भाषा मॉडलों पर दोहराया गया, जिनमें ओपन एआई का जीपीटी 2, मेटा का लामा 3.2 और गूगल का जेमा 2 शामिल हैं, ताकि यह पता चल सके कि इन प्रकार के मॉडल श्रेणियों के बीच कितनी अच्छी तरह भेद करते हैं।
अध्ययन में पाया गया कि पर्याप्त आकार के मॉडल वास्तव में विशिष्ट गणितीय पैटर्न, या ‘वेक्टर’ विकसित करते हैं, जो प्रत्येक संभावना श्रेणी के साथ दृढ़ता से सहसंबद्ध होते हैं। ये वेक्टर सबसे समान श्रेणियों – जैसे असंभावित बनाम असंभव घटनाओं – के बीच भी लगभग 85% सटीकता के साथ अंतर कर सकते हैं।
लेपोरी कहते हैं कि इससे भी बढ़कर, अध्ययन द्वारा प्रकट किए गए वेक्टर इस बात को दर्शाते हैं कि मानवीय अनिश्चितता क्या है कि एक कथन किस श्रेणी में आ सकता है। उदाहरण के लिए, “किसी ने टोपी से फर्श साफ किया” कथन को लें। जब लोग इस कथन को सुनते हैं, तो वे इस बात पर असहमत हो सकते हैं कि यह कुछ असंभव का प्रतिनिधित्व करता है या सिर्फ असंभावित का। अध्ययन के लिए, शोधकर्ताओं ने यह देखने के लिए वैक्टर का विश्लेषण किया कि AI सिस्टम इन कथनों को कितना अस्पष्ट मानते हैं, और इसकी तुलना मानव प्रतिभागियों से सर्वेक्षण परिणामों से की।
लेपोरी बताते हैं, “हम जो दिखाते हैं वह यह है कि मॉडल वास्तव में उस मानवीय अनिश्चितता को बहुत अच्छी तरह से पकड़ते हैं।” “जिन मामलों में, उदाहरण के लिए, 50% लोगों ने कहा कि एक कथन असंभव था और 50% ने कहा कि यह असंभावित था, मॉडल भी लगभग 50% संभावना दे रहे थे।”
कुल मिलाकर, परिणाम बताते हैं कि आधुनिक AI भाषा मॉडल वास्तव में वास्तविक दुनिया की एक समझ विकसित कर सकते हैं जो मानवीय समझ को दर्शाती है। शोध में पाया गया कि ये वेक्टर 2 अरब से अधिक पैरामीटर वाले मॉडलों में उभरने लगते हैं, जो आज के खरबों-प्लस-पैरामीटर मॉडलों की तुलना में काफी छोटा है।
व्यापक रूप से, शोधकर्ता कहते हैं कि इस तरह के यांत्रिक व्याख्यात्मकता अध्ययन AI मॉडलों को क्या पता है और वे इसे कैसे जानते हैं, इसकी बेहतर समझ विकसित करने में मदद कर सकते हैं। और यह, शोधकर्ताओं का कहना है, समझदार, अधिक भरोसेमंद मॉडल विकसित करने में मदद करेगा।
संदर्भ और कड़ियां (References & Links)
- मूल समाचार विज्ञप्ति: ब्राउन विश्वविद्यालय (Brown University)
- शोध पत्र: आर्काइव पर शोध पत्र
- अंतर्राष्ट्रीय सम्मेलन: इंटरनेशनल कॉन्फ्रेंस ऑन लर्निंग रिप्रेजेंटेशन (International Conference on Learning Representations)
- संबंधित संस्थान: ब्राउन का कार्नी इंस्टीट्यूट फॉर ब्रेन साइंस (Carney Institute for Brain Science)




