13 अगस्त, 2025 को बीजिंग, चीन में दुनिया के पहले सन्निहित बुद्धिमान रोबोट 4S स्टोर, रोबोट मॉल में एक यांत्रिक हाथ प्रदर्शित किया गया है।
वीसीजी | विजुअल चाइना ग्रुप | गेटी इमेजेज
बीजिंग— अलीबाबा क्लाउड एक नई तरह की कृत्रिम बुद्धिमत्ता में निवेश कर रहा है जिसे ओपनएआई के चैटजीपीटी जैसे चैटबॉट्स की तुलना में एक अलग दृष्टिकोण के माध्यम से वास्तविक दुनिया को बेहतर ढंग से दोहराने के लिए डिज़ाइन किया गया है।
शिफ्ट को पहचानता है “बड़े भाषा मॉडल” की सीमाएँ मुख्यतः पाठ पर प्रशिक्षण दिया गया। इसके बजाय, डेवलपर्स अधिक ध्यान केंद्रित करना शुरू कर रहे हैं विश्व मॉडल“वीडियो और वास्तविक भौतिक परिदृश्यों पर आधारित।
इस प्रवृत्ति पर कूदने के लिए, अलीबाबा ने एआई वीडियो जेनरेशन टूल विदु के पीछे के स्टार्टअप शेंगशू में 2 बिलियन युआन ($290 मिलियन) के निवेश का नेतृत्व किया है, कंपनी ने शुक्रवार को घोषणा की। टीएएल एजुकेशन और Baidu वेंचर्स ने भी सीरीज बी फंडिंग राउंड में भाग लिया।
शेंगशु द्वारा धन जुटाने के लगभग दो महीने बाद यह निवेश आया है 600 मिलियन युआन किमिंग वेंचर पार्टनर्स और अन्य समर्थकों से। स्टार्टअप ने अपने मूल्यांकन का खुलासा करने से इनकार कर दिया।
शेंगशू ने कहा कि नवीनतम फंडिंग एक “सामान्य विश्व मॉडल” के विकास का समर्थन करेगी जो वर्तमान में दो अलग-अलग डोमेन को जोड़ने के लिए एआई का उपयोग करता है: गेम की डिजिटल दुनिया और एआई-जनित वीडियो, और स्वायत्त ड्राइविंग और रोबोट की भौतिक दुनिया।
तीन साल पुराने स्टार्टअप ने एक बयान में कहा, “शेंगशु का मानना है कि एक सामान्य विश्व मॉडल, जो दृष्टि, ऑडियो और स्पर्श जैसे मल्टीमॉडल डेटा पर बनाया गया है, बड़े भाषा मॉडल की तुलना में अधिक स्वाभाविक रूप से दर्शाता है कि भौतिक दुनिया कैसे काम करती है।”

शेंगशू के संस्थापक झू जून ने एक बयान में कहा, “हमारा लक्ष्य धारणा और कार्रवाई को जोड़ना है, जिससे एआई सिस्टम लगातार बेहतर मॉडल और वास्तविक दुनिया के व्यवहार की भविष्यवाणी करने में सक्षम हो सके।”
जनवरी में जारी शेंगशू का नवीनतम विदु क्यू3 प्रो मॉडल, टेक्स्ट और छवियों से वीडियो बनाने के लिए शीर्ष 10 एआई मॉडल में से एक है। कृत्रिम विश्लेषण.
कंपनी ने लॉन्च किया विदु दुनिया भर में कुछ महीने पहले ही OpenAI ने इसे बंद कर दिया था एआई वीडियो के लिए सोरा टूल पीढ़ी व्यापक रूप से उपलब्ध है। चीनी लघु वीडियो कंपनियाँ Kuaishou और बाइटडांस ने भी इसी तरह के प्रतिस्पर्धी जारी किए वीडियो बनाने के लिए एआई उपकरण.
विश्व मॉडल प्रतियोगिता
अलीबाबा ने संबंधित स्टार्टअप्स में अपने निवेश का विस्तार किया है।
चीनी टेक दिग्गज और Baidu वेंचर्स ने पिछले महीने एक समझौते पर हस्ताक्षर किए थे $50 मिलियन का निवेश ट्रिपो एआई में, एक ऐसा प्लेटफ़ॉर्म जो फ़ोटो से डिजिटल 3डी मॉडल तुरंत तैयार करने के लिए एआई का उपयोग करता है। ट्रिपो ने कहा कि यह भाषा मॉडल द्वारा उपयोग की जाने वाली तकनीकों से दूर भौतिक स्थान पर आधारित एआई टूल की ओर बढ़ रहा है और अपना स्वयं का विश्व मॉडल विकसित कर रहा है।
सितंबर में, अलीबाबा ने PixVerse में $60 मिलियन के निवेश का भी नेतृत्व किया, जिसने AI जारी किया विश्व मॉडल इस वर्ष की शुरुआत में जो उपयोगकर्ताओं को इसकी अनुमति देता है निर्देशित करता है कि एक वीडियो कैसे सामने आता है जबकि यह उत्पन्न हो रहा है।
ई-कॉमर्स में अपनी शुरुआत करने वाले अलीबाबा ने वीडियो जेनरेशन के लिए मुफ्त, ओपन-सोर्स एआई मॉडल भी जारी किया है, जिसे फरवरी में लॉन्च किया जाएगा। रोबोट चलाने के लिए.
शेंगशू ने शुक्रवार को कहा कि उसने औद्योगिक, वाणिज्यिक और घरेलू सेटिंग्स में उपयोग के लिए भौतिक दुनिया के साथ बातचीत करने वाले मानव सदृश रोबोट जैसी प्रणालियों को विकसित करने वाली कंपनियों के साथ रणनीतिक साझेदारी की है।
अमेरिकी प्रौद्योगिकी पत्रिका वायर्ड के सह-संस्थापक केविन केली ने लिखा, विश्व मॉडल रोबोटिक्स के लिए महत्वपूर्ण हैं क्योंकि प्रौद्योगिकी को काम करने के लिए एलएलएम से अधिक की आवश्यकता है। पिछला महीना इसके सबस्टैक पर।
अंततः, मानव बुद्धि को दोहराने के लिए, एआई को तीन चीजों की आवश्यकता होगी: तर्क, भौतिक दुनिया की समझ और निरंतर सीखना, केली ने कहा। उन्होंने कहा, जबकि सीखने की श्रेणी के लिए एआई अभी तक विकसित नहीं हुआ है, एलएलएम-संचालित चैटबॉट्स ने ज्ञान तत्व तैयार किया है, जिससे विश्व मॉडल एक प्रमुख क्षेत्र बन गया है जिसमें एक सफलता की आवश्यकता है।
