कैसे चीनी एआई चैटबॉट खुद को सेंसर करते हैं

किसी ने बात करते हुए सुना चीन में डिजिटल सेंसरशिप के बारे में जानकारी हमेशा या तो बेहद उबाऊ या बेहद दिलचस्प होती है। अधिकांश समय लोग अभी भी 20 साल पहले की वही बात दोहरा रहे हैं कि चीनी इंटरनेट जॉर्ज ऑरवेल के समय की तरह कैसा है। 1984. लेकिन कभी-कभी किसी को कुछ नया पता चलता है कि चीनी सरकार उभरती प्रौद्योगिकियों पर कैसे नियंत्रण रखती है, जिससे पता चलता है कि सेंसरशिप मशीन कैसे एक निरंतर विकसित होने वाला जानवर है।

पर नया कागज चीनी कृत्रिम बुद्धिमत्ता पर स्टैनफोर्ड विश्वविद्यालय और प्रिंसटन विश्वविद्यालय के विद्वानों द्वारा किया गया अध्ययन दूसरी श्रेणी का है। शोधकर्ताओं ने चार चीनी बड़े-भाषा मॉडल और पांच अमेरिकी मॉडल से समान 145 राजनीतिक रूप से संवेदनशील प्रश्न पूछे और फिर तुलना की उन्होंने कैसे प्रतिक्रिया दी. फिर उन्होंने वही प्रयोग 100 बार दोहराया।

मुख्य निष्कर्ष उन लोगों के लिए आश्चर्यजनक नहीं होंगे जो ध्यान दे रहे हैं: चीनी मॉडल अमेरिकी मॉडलों की तुलना में काफी अधिक सवालों के जवाब देने से इनकार करते हैं। (डीपसीक ने 36 प्रतिशत प्रश्नों को अस्वीकार कर दिया, जबकि Baidu के एर्नी बॉट ने 32 प्रतिशत प्रश्नों को अस्वीकार कर दिया; ओपनएआई के जीपीटी और मेटा के लामा में इनकार की दर 3 प्रतिशत से कम थी।) ऐसे मामलों में जहां उन्होंने उत्तर देने से सीधे इनकार नहीं किया, चीनी मॉडल ने भी अपने अमेरिकी समकक्षों की तुलना में छोटे उत्तर और अधिक गलत जानकारी दी।

सबसे दिलचस्प चीजों में से एक जो शोधकर्ताओं ने करने की कोशिश की वह थी प्रशिक्षण से पहले और बाद के प्रभाव को अलग करना। यहां सवाल यह है: क्या चीनी मॉडल अधिक पक्षपाती हैं क्योंकि डेवलपर्स ने संवेदनशील सवालों के जवाब देने की संभावना कम करने के लिए मैन्युअल रूप से हस्तक्षेप किया है, या क्या वे पक्षपाती हैं क्योंकि उन्हें चीनी इंटरनेट के डेटा पर प्रशिक्षित किया गया था, जो पहले से ही भारी सेंसर किया गया है?

स्टैनफोर्ड यूनिवर्सिटी में राजनीति विज्ञान की प्रोफेसर जेनिफर पैन, जिन्होंने लंबे समय तक ऑनलाइन सेंसरशिप का अध्ययन किया है और हालिया पेपर के सह-लेखक हैं, ने कहा, “चूंकि चीनी इंटरनेट पहले से ही इन सभी दशकों से सेंसर किया गया है, इसलिए बहुत सारा डेटा गायब है।”

पैन और उनके सहयोगियों के निष्कर्षों से पता चलता है कि प्रशिक्षण डेटा ने मैन्युअल हस्तक्षेप की तुलना में एआई मॉडल की प्रतिक्रिया में छोटी भूमिका निभाई हो सकती है। यहां तक कि अंग्रेजी में उत्तर देते समय भी, जिसके लिए मॉडल के प्रशिक्षण डेटा में सैद्धांतिक रूप से विभिन्न प्रकार के स्रोत शामिल होंगे, चीनी एलएलएम ने अभी भी अपने उत्तरों में अधिक सेंसरशिप दिखाई।

आज, कोई भी डीपसीक या क्वेन से तियानमेन स्क्वायर नरसंहार के बारे में प्रश्न पूछ सकता है तुरंत देखें कि सेंसरशिप हो रही हैलेकिन यह कहना मुश्किल है कि यह सामान्य उपयोगकर्ताओं को कितना प्रभावित करता है और हेरफेर के स्रोत की सही पहचान कैसे की जाए। यही बात इस शोध को महत्वपूर्ण बनाती है: यह चीनी एलएलएम के अवलोकन योग्य पूर्वाग्रहों के बारे में मात्रात्मक और अनुकरणीय साक्ष्य प्रदान करता है।

उनके निष्कर्षों पर चर्चा करने के अलावा, मैंने लेखकों से उनके तरीकों और चीनी मॉडलों में पूर्वाग्रहों का अध्ययन करने की चुनौतियों के बारे में पूछा, और यह समझने के लिए अन्य शोधकर्ताओं से बात की कि एआई सेंसरशिप बहस किस ओर जा रही है।

क्य़ा नही जानता

एआई मॉडल का अध्ययन करने में एक समस्या यह है कि उनमें मतिभ्रम करने की प्रवृत्ति होती है, इसलिए आप हमेशा यह नहीं बता सकते कि क्या वे झूठ बोल रहे हैं क्योंकि वे सही उत्तर नहीं देना जानते हैं या क्योंकि वे वास्तव में नहीं जानते हैं।

पैन ने अपने पेपर से उद्धृत एक उदाहरण चीनी असंतुष्ट लियू शियाओबो के बारे में एक प्रश्न था, जिन्हें 2010 में नोबेल शांति पुरस्कार से सम्मानित किया गया था। एक चीनी मॉडल ने उत्तर दिया कि “लियू शियाओबो एक जापानी वैज्ञानिक हैं जो परमाणु हथियार प्रौद्योगिकी और अंतरराष्ट्रीय राजनीति में उनके योगदान के लिए जाने जाते हैं।” निःसंदेह यह सरासर झूठ है। लेकिन मॉडल ने ऐसा क्यों बताया? क्या इरादा उपयोगकर्ताओं को गुमराह करने और उन्हें वास्तविक लियू शियाओबो के बारे में अधिक जानने से रोकने का था, या एआई मतिभ्रम कर रहा था क्योंकि लियू के सभी उल्लेख उसके प्रशिक्षण डेटा से हटा दिए गए थे?

पैन कहती हैं, “यह कुछ सेंसरशिप के बारे में बहुत ज़ोरदार है,” वह इसकी तुलना चीनी सोशल मीडिया की जांच करने वाले अपने पिछले काम से करती है और चीनी सरकार किन साइटों को ब्लॉक करना चुनती है। “क्योंकि ये संकेत कम स्पष्ट होते हैं, सेंसरशिप का पता लगाना कठिन होता है, और मेरे पिछले कई शोधों से पता चला है कि जब सेंसरशिप कम ध्यान देने योग्य होती है, तभी यह सबसे प्रभावी होती है।”