माइक्रोसॉफ्ट ने पेश किए दो नए एआई मॉडल, ओपनएआई को दी सीधी टक्कर

माइक्रोसॉफ्ट की एआई में नई छलांग

गुरुवार को माइक्रोसॉफ्ट ने अपने पहले इन-हाउस आर्टिफिशियल इंटेलिजेंस (AI) मॉडल्स – MAI-Voice-1 और MAI-1 Preview – के लॉन्च की घोषणा की। अब तक माइक्रोसॉफ्ट AI के लिए मुख्य रूप से ओपनएआई के GPT मॉडल्स पर निर्भर था, खासकर Copilot जैसी सेवाओं में। लेकिन इन नए मॉडल्स के साथ कंपनी अब सीधे-सीधे ChatGPT की निर्माता कंपनी ओपनएआई और अन्य AI कंपनियों की प्रतिस्पर्धा में उतर चुकी है।

MAI-Voice-1: उन्नत और तेज वॉइस जनरेशन

MAI-Voice-1 को एक शक्तिशाली स्पीच जनरेशन मॉडल बताया गया है, जो एक मिनट की ऑडियो मात्र एक सेकंड से भी कम समय में और केवल एक GPU का उपयोग करके बना सकता है। माइक्रोसॉफ्ट के मुताबिक, यह मॉडल सिंगल और मल्टी-स्पीकर परिदृश्यों दोनों में काम करता है और हाई-क्वालिटी वॉइस आउटपुट प्रदान करता है।

यह मॉडल अब Copilot Daily और Podcast फ़ीचर्स में उपयोग किया जा रहा है। इसके साथ ही, Copilot Labs के भीतर भी इसे लॉन्च किया गया है, जहां उपयोगकर्ता इंटरएक्टिव ऑडियो-आधारित प्रयोग जैसे “अपना खुद का एडवेंचर चुनें” शैली की कहानियाँ और गाइडेड मेडिटेशन अनुभव कर सकते हैं।

MAI-1 Preview: टेक्स्ट के लिए निर्देश-आधारित मॉडल

MAI-1 Preview माइक्रोसॉफ्ट का एक बेसिक ‘फाउंडेशन मॉडल’ है, जिसे लगभग 15,000 NVIDIA H100 GPUs पर ट्रेन और फाइन-ट्यून किया गया है। यह मॉडल खासकर टेक्स्ट-आधारित प्रश्नों के उत्तर देने की क्षमता के लिए तैयार किया गया है।

यह अब LMArena नामक एक पब्लिक प्लेटफॉर्म पर टेस्टिंग के लिए उपलब्ध है, जो बड़े भाषा मॉडल्स की तुलना करने का एक क्राउडसोर्स्ड प्लेटफॉर्म है। फिलहाल MAI-1 Preview इस प्लेटफॉर्म की लीडरबोर्ड में 13वें स्थान पर है – GPT-5, Gemini 2.5 Pro, DeepSeek R-1 और Grok-3 जैसे प्रतिस्पर्धियों से पीछे।

सीमित संसाधनों में बड़ा प्रदर्शन

माइक्रोसॉफ्ट AI के प्रमुख मुस्तफा सुलेमान ने Semafor से बातचीत में बताया कि कंपनी ने ओपन-सोर्स समुदाय से कई सबक सीखे हैं, जिससे सीमित संसाधनों के बावजूद मॉडल की क्षमताएं बढ़ाई जा सकीं।

सुलेमान के अनुसार, “अब मॉडल ट्रेनिंग की कला यह तय करने में है कि सही डेटा का चुनाव हो और अनावश्यक टोकन पर संसाधनों की बर्बादी न हो।” उन्होंने यह भी बताया कि माइक्रोसॉफ्ट पहले से ही अपने अगले AI मॉडल वर्जन पर काम कर रहा है, जिसे NVIDIA के नवीनतम GB200 चिप्स से लैस विश्व के सबसे बड़े डेटा सेंटर्स में तैयार किया जा रहा है।

भविष्य की रणनीति: मल्टी-मॉडल AI प्लेटफॉर्म

माइक्रोसॉफ्ट ने अपने ब्लॉग पोस्ट में कहा कि उनकी योजना केवल एक या दो मॉडलों तक सीमित नहीं है, बल्कि वे विशिष्ट उद्देश्यों और उपयोगकर्ताओं की ज़रूरतों के अनुसार तैयार किए गए विभिन्न मॉडलों की एक श्रृंखला विकसित करना चाहते हैं।

इन प्रयासों के तहत कंपनी का अगला कदम है GB200 क्लस्टर का उपयोग – जो मॉडल के बड़े पैमाने पर विकास और तैनाती को संभव बनाएगा। माइक्रोसॉफ्ट का इरादा अपने इन-हाउस मॉडल्स, ओपन-सोर्स इनोवेशन्स और साझेदार तकनीकों के मिश्रण से Copilot और अन्य AI अनुभवों को बेहतर बनाना है, जिससे हर दिन लाखों इंटरैक्शन में सुधार हो।

निष्कर्ष

MAI-Voice-1 और MAI-1 Preview के लॉन्च से यह स्पष्ट हो गया है कि माइक्रोसॉफ्ट अब AI क्षेत्र में केवल साझेदार नहीं बल्कि एक अग्रणी खिलाड़ी बनने की ओर बढ़ रही है। जहां एक ओर MAI-Voice-1 वॉइस-आधारित अनुभवों को और जीवंत बनाता है, वहीं MAI-1 Preview टेक्स्ट-आधारित निर्देशों पर केंद्रित है। इन दोनों मॉडल्स के साथ माइक्रोसॉफ्ट ने AI की दुनिया में एक नया अध्याय शुरू किया है – जिसमें दक्षता, स्केलेबिलिटी और उपयोगकर्ता केंद्रितता की नई परिभाषा गढ़ी जा रही है।