Sunday, April 16, 2023

चैट-जीपीटी

 चैट-जीपीटी - इंसानी अजूबा या धोखेबाजों के हाथ नया औजार?

- 'स्रोत' के फरवरी अंक में प्रकाशित

मैं जिस संस्थान में काम करता हूँ,  पिछले ढाई महीनों से वहां कई अध्यापक ईमेल पर 'चैट-जीपीटी' पर चर्चा कर रहे हैं। दरअसल दुनिया भर में तालीम और अध्यापन से जुड़े लोगों में बड़ी संजीदगी से  यह चर्चा चल रही है। खास तौर पर मौलिक लेखन को लेकर एक संकट सा फैलता दिख रहा है। यह चैट-जीपीटी क्या है? 

ए-आई की दौड़ में मील का पत्थर - चैट-जीपीटी

हाल में कंप्यूटर साइंस और सूचना टेक्नोलॉजी में जो बड़े पैमाने की तरक्की हुई है, उसी की एक कड़ी ए-आई यानी कृत्रिम बुद्धि या गैर कुदरती समझ में हुए शोध की है। इस के कई अलग पहलुओं में रोबोटिक्स, भाषा की प्रोसेसिंग (एन-एल-पी या नैटरल लैंग्वेज़ प्रोसेसिंग) आदि हैं। चैट-जीपीटी या (ChatGPT - Chat Generative Pre-trained Transformer) ओपन-एआई नाम की एक कंपनी द्वारा बनाया ऐसा सॉफ्टवेयर है, जिससे पहले से 'प्री-ट्रेन्ड' या पर्याप्त रूप से पढ़ाया जा चुका कंप्यूटर, किसी विषय को समझ कर उसके बारे में नए लेख 'जेनरेट' यानी अपनी ओर से पेश कर सकता है। इसके अलावा इसके और भी कई चमत्कार हैं, जैे कलाकृतियाँ या गीत आदि पेश करना, पर लेखन में इसकी महारत को लेकर ज्यादा शंकाएँ हैं।

एल-एल-एम यानी  लार्ज लैंग्वेज़ मॉडल -  चैटबॉट

नवंबर 2022 के आखिरी दिन बाज़ार में आया यह सॉफ्टवेयर दरअसल लंबे समय से चले आ रहे शोध की एक कड़ी है। ऐसे पहले आ चुके मॉडल GPT-3 सिलसिले के के लार्ज लैंग्वेज़ (large language) मॉडल (LLM) या चैट-बॉट (chatbot) कहलाते थे। बॉट शब्द रोबोट से आया है। 'चैट' यानी कंप्यूटर से गुफ्तगू। जब इंटरनेट पर मौजूद किसी सॉफ्टवेयर-प्रोग्राम से बार-बार खास किस्म का काम करवाया जा सके (भला या बुरा कुछ भी), तो उसे बॉट कहा जाता है। चैट-जीपीटी को भी चैट-बॉट ही कहा जाता है; इस की खासियत पहले आए मॉडल की तुलना में कहीं ज्यादा बेहतर समझ और उसके मुताबिक लेख तैयार करने में है। 

शंकाएँ

क़माल इस बात का है कि हालांकि चैट-जीपीटी से तैयार किए गए लेख पूरी तरह सही नहीं होते, और ध्यान से पढ़ने पर उनमें ग़लतियां दिख जाती हैं, फिर भी हर किस्म के लेखन की दुनिया में इसे लेकर बड़ी फिक्र जताई जा रही है। विज्ञान की नामी शोध पत्रिकाओं में, जिनमें 'नेचर' शामिल है, आम पाठकों और वैज्ञानिक समुदाय को इसके ग़लत इस्तेमाल पर सचेत करते हुए आलेख छपे हैं। यह आशंका जताई गई है की आधुनिक विज्ञान की जटिलता की वजह से चैट-जीपीटी की मदद से तैयार किए गए जाली लेखों के सार पढ़कर विषय के माहिर यह तय नहीं कर पाएंगे कि यह लेख जाली हैं और ऐसे लेखों को छापने की रज़ामंदी दे देंगे। 

 न्यूरॉन-तंत्र से प्रेरित जटिल सॉफ्टवेयर

चैट-बॉट को समझने का एक आसान तरीका गूगल-ट्रांसलेशन हो सकता है। अगर आप गूगल कंपनी के इस तकनीक का इस्तेमाल करते हैं, तो आप जानते होंगे कि बार-बार इस्तेमाल करने से तरजुमा का स्तर बेहतर होता जाता है; यानी कि पहली कोशिश में जो ग़लतियां होती हैं और हम उन्हें सुधारते हैं तो कंप्यूटर उस सुधार को समझ लेता है और अगली कोशिशों में वह संशोधित शब्द या वाक्य ही सामने लाता है। चैट-बॉट की बुनियाद में इसे और भी ऊँचे स्तर तक ले जाया गया है। ए-आई यानी कृत्रिम बुद्धि के शोध में इसे मशीन-लर्निंग यानी मशीन का सीखना कहा जाता है। जैविक न्यूरॉन-तंत्र से प्रेरित जटिल सॉफ्टवेयर तैयार किए गए हैं, जिनमें जैविक-तंत्र की तरह ही सूचना की प्रोसेसिंग होती है, और जैसे हमारा ज़हन किसी प्राप्त जानकारी के प्रति कोई प्रतिक्रिया रखता है, उसी तरह कंप्यूटर भी दी गई जानकारी को सीख कर किसी कहे मुताबिक एक प्रतिक्रिया सामने रखता है। इसी तरह के शोध की सबसे अगली कड़ी में चैट-बॉट होते हैं। इनका इस्तेमाल दरअसल लेखन को बेहतर बनाने के लिए यानी ग़लतियों को कम करने के लिए ही किया जाना चाहिए। इस का फायदा उठाते हुए कई लोगों ने शोध के आंकड़ों को चैट-बॉट में दर्ज करते हुए बेहतरीन परचे तैयार किए हैं। जाहिर है कि पूरी तरह चैट-बॉट का लिखा परचा सही नहीं हो सकता, क्योंकि मशीन आखिर मशीन है और उससे सौ फ़ीसदी सही नतीजा नहीं आ सकता। फिर भी गड़बड़ी की आशंका बेवजह नहीं है -  जैसे बिल्कुल नए किसी शोध पर भरपूर महारत ना होना, या व्यस्तता के कारण सरसरी निगाह से सामने आए लेख को देखना, आदि कई वजहों से, अक्सर पूरी तरह सही ना होते हुए भी लेख छप जाते हैं। इसी तरह अध्यापक अगर बड़ी तादाद में छात्रों की कॉपियां जांचते हैं तो अक्सर किसी का लिखा पूरा पढ़ पाना मुमकिन नहीं होता; यानी तजुर्बे के आधार पर जितना हो सके पढ़कर जांच का नतीजा तय लेता है - यहीं पर चैट-जीपीटी जैसे ताकतवर सॉफ्टवेयर से खतरा पेश आता है।

आमतौर पर नकल या जाली काम पकड़ने के लिए प्लेजियरिज़्म यानी नकल-पकड़ चेकर (plagiarism checker)  सॉफ्टवेयर का इस्तेमाल होता है। ऐसा पाया गया है कि अक्सर चैट-बॉट से तैयार लेखों के सार इस तरह की जांच से बच निकले हैं। इससे वैज्ञानिक लेखन की नैतिकता को लेकर बड़े सवाल सामने आए हैं और नेचर पत्रिका और ए-आई पर होने वाले सबसे मशहूर सम्मेलनों में आने वाले परचों के लिए चैट-जीपीटी के इस्तेमाल पर मनाही हो गई है। दुनिया भर में तालीम के संस्थान चैट-जीपीटी पर नई नीतियां तय कर रहे हैं; मसलन न्यूयॉर्क शहर में सभी स्कूलों में चैट-जीपीटी के इस्तेमाल पर पाबंदी लगा दी गई है, यानी इन स्कूलों में मौजूद किसी भी कंप्यूटर पर और इंटरनेट के जरिए उपलब्ध संसाधनों में चैट-जीपीटी पर रोक लगा दी गई है। यह रोक छात्रों के सही ज्ञान पाने और मिल रही जानकारी की प्रमाणिकता को लेकर शंकाओं की वजह से लगाई गई है।  कई विषयों में सामान्य जानकारियाँ सुनकर चैट-बॉट बेहतरीन निबंध तैयार कर सकता है। इससे छात्रों को अभ्यास के लिए दी गई सामग्री की जांच के नतीजे सही ना हो पाने की आशंका बढ़ गई और ऐसा लगने लगा कि चैट-बॉट की मदद से जाली काम और नकल को बढ़ावा मिलेगा। अमेरिका के कई दूसरे शहरों में भी इस तरह के प्रतिबंध लगाए जा रहे हैं या उन पर सोचा जा रहा है।

रोक लगाना समस्या का हल नहीं

ऐसी शंकाएँ पहले भी जताई जा चुकी हैं, जब चैट-बॉट जैसे ताकतवर सॉफ्टवेयर नहीं होते थे और कंप्यूटर या ए-आई टेक्नोलोजी में कोई विलक्षण तरक्की हुई थी। इसलिए कई माहिरों का कहना है कि रोक लगाने से समस्या का निदान  नहीं होता है। दूसरी ओर चैट-जीपीटी से जो फायदे होने हैं, रोक लगने पर उनसे छात्र वंचित रह जाएँगे। बेहतर यह है कि अभ्यास के लिए कैसा काम दिया जाए, इस पर सोचा जाए, जैसे हाल में मिली जानकारियों पर आधारित काम दिए जाएँ, जिन पर चैट-जीपीटी के तंत्र में जानकारी नहीं होगी। ऐसा भी हो सकता है कि छात्रों से सचेत रूप से चैट-जीपीटी का इस्तेमाल करने को कहा जाए और इससे मिले आउटपुट पर आलोचनात्मक टिप्पणी करने को कहा जाए, ताकि यह पता चल सके कि छात्र को वाक़ई विषय की कितनी समझ है। या उन्हें क्लास में सवालों के जवाब पूछे जाएँ, जिससे उनकी क़ाबिलियत का सही अंदाज़ा हो सके। 

मूल समस्या पूँजीवादी समाज-तंत्र 

मूल समस्या यह है कि पूँजीवादी समाज-तंत्र में कम लागत पर ज्यादा से ज्यादा काम लेने की कोशिश की वजह से ये सारे विकल्प नाकामयाब रह जाते हैं, क्योंकि अक्सर अध्यापकों के पास इतना वक्त नहीं होता कि वे जाँच के लिए ज़रूरी भरपूर ध्यान दें। साथ ही जहाँ समाज में गैर-बराबरी है, अगर चैट-जीपीटी का कोई फायदा है तो बस उनके लिए है जो इसके इस्तेमाल का खर्चा उठा पाएँगे। 

विज्ञान लेखन में नैतिकता 

नैतिकता को ध्यान में रख कर, कई वैज्ञानिक चैटबॉट का इस्तेमाल करने पर लेखकों की प्रकाशित सूची में चैट-जीपीटी को भी शामिल कर रहे हैं, पर वैज्ञानिकों में से ज्यादातर इसके खिलाफ हैं। यह मुमकिन है चैट-जीपीटी को लेखक कहना एक मजाक हो सकता है - पालतू जानवरों और नकली नामों को शामिल करने के ऐसे मजाक पहले भी होते रहे हैं। पर ऐसा भी हो सकता है कि शोध की जानकारियों को ग़लत ढंग से लिखने या जाली बातें लिख कर पकड़े जाने से बचने के लिए भी कोई चैट-जीपीटी को लेखकों में शामिल करे। इसलिए प्रकाशन-संस्थाएँ इस बात को संजीदगी से ले रही हैं और लेखकों को अपने लिखे की पूरी जिम्मेदारी लेने के लिए कह रही हैं। वैज्ञानिक परचों में एक से ज्यादा लेखकों का होना आम बात है, क्योंकि शोध के काम में कोई मूल सवालों पर सोचता है, कोई प्रयोग करता है, आदि, और इस वजह से अलग-अलग किस्म की भागीदारी होती है, जिसकी सही स्वीकृति मिलना लाजिम है।  

टेक्नोलोजी बनाम इंसान

सूचना टेक्नोलोजी की बड़ी कंपनी माइक्रोसॉफ्ट ने ओपेन-आई कंपनी में दस बिलियन (अरब) डॉलर पैसा लगाने का तय किया है, जो कुछ सालों तक लगातार किश्तों में खर्च किया जाएगा।  माइक्रोसॉफ्ट ने पहले ही तीन अरब  डॉलर ओपेन-आई में लगाए हैं। जाहिर है कि बड़ी टेक-कंपनियों ने चैट-जीपीटी की कामयाबी को बड़ी संजीदगी से लिया है। पर इससे एक और खतरा सामने आता दिखता है। हाल में ही माइक्रोसॉफ्ट समेत कई कंपनियों ने बड़ी तादाद में कर्मचारियों की छँटाई की घोषणा की है। जैसे-जैसे मशीनों की काबिलियत बढ़ेगी, इंसान की मेहनत गैर-ज़रूरी होती जाएगी। इससे बेरोज़गारी बढ़ेगी और समाज में तनाव बढ़ेंगे।  माइक्रोसॉफ्ट के मुख्य प्रबंधन प्रभारी सत्य नेडेला ने कहा है कि दस हजार लोगों के छँटाई के बाद कंपनी ए-आई के शोध पर ज्यादा फोकस कर पाएगी। 

जैसा अक्सर होता है, ओपेन-आई कंपनी की शुरूआत मुनाफा न कमा कर शोध पर काम करने के लिए हुई थी, पर वक्त के साथ शोध के लिए पैसे जुटाने के लिए कंपनी में तैयार सॉफ्टवेयर को बाज़ार में बेचा जाने लगा और आज यह चैटबॉट बनाने वाली सबसे कामयाब और बेइंतहा मुनाफा कमाने वाली कंपनी बन चुकी है। 

रोचक बात यह है कि टेक्नोलोजी से आई बीमारियों का इलाज़ सतही तौर पर टेक्नोलोजी में ही ढूँढा जाता है। बेशक जहाँ पर्याप्त सुविधा हो, ए-आई का इस्तेमाल बढ़ता चलेगा। इसे खारिज करना आसान नहीं है, पर सावधानी और ग़लत इस्तेमाल के रोकथाम की गुंजाइश रहेगी। आखिर कौन नहीं चाहता कि कोई धोखेबाज हमें उल्लू न बनाए! चैट-जीपीटी के ग़लत इस्तेमाल को पकड़ने के लिए कई नए सॉफ्टवेयर तैयार हो चुके हैं, जिनमें  ओपेन-आई-डिटेक्टर, जी-एल-टी-आर, जीपीटी-ज़ीरो आदि मुख्य हैं। इनकी मदद से अध्यापक यह पकड़ सकते हैं कि किसी छात्र ने खुद अभ्यास का काम न कर  चैटबॉट की मदद से किया है। जहाँ इम्तहानों में छूट दी जाती है कि छात्र घर बैठ कर भी सवाल हल कर सकें, वहाँ भी इन चैट-जीपीटी प्रतिरोध ऐप आदि से पकड़ना आसान हो गया है कि किसी ने मौलिक काम किया है या नहीं। इस दिशा में बहुत सारा शोध जारी है और उम्मीद यही है कि  चैट-जीपीटी से जितना खतरा आँका गया है, आखिर में ऐसा न होकर इसका बेहतर इस्तेमाल ही होता रहेगा।  फिलहाल यही कहा जा सकता है कि आखिरी जीत इंसान की समझ और इल्म की ही होगी और टेक्नोलोजी एक हद तक ही हमें मात दे पाएगी। 


No comments: