- माइक्रोसॉफ्ट ने अपना पहला इन-हाउस टेक्स्ट-टू-इमेज मॉडल MAI‑Image‑1 लॉन्च किया है
- मॉडल गति, फोटोयथार्थवाद और लचीलेपन पर ध्यान केंद्रित करता है, जिसका लक्ष्य दोहराए जाने वाले दृश्य ट्रॉप्स से बचना है
- MAI-इमेज-I जल्द ही कोपायलट और बिंग पर आ रहा है
माइक्रोसॉफ्ट ने हाल ही में अपना पहला इन-हाउस टेक्स्ट-टू-इमेज जनरेटर MAI‑Image‑1 पेश किया है। इन-हाउस मॉडल का निर्माण करके, Microsoft एक नया दावा पेश कर रहा है, जो न केवल Google के नैनो बनाना और मिडजर्नी जैसे उद्योग के दिग्गजों के साथ प्रतिस्पर्धा कर रहा है, बल्कि इसके अन्यथा बहुत करीबी भागीदार, OpenAI की AI छवि मॉडल की अपनी लाइन के साथ भी प्रतिस्पर्धा कर रहा है।
MAI‑Image‑1 ने पहले ही LMArena लीडरबोर्ड पर शीर्ष 10 में जगह बना ली है, जो एक सार्वजनिक बेंचमार्किंग प्लेटफ़ॉर्म है, जहां यह अभी के लिए उपलब्ध एकमात्र स्थान है। हालाँकि, यह जल्द ही बदल जाएगा, जैसा कि माइक्रोसॉफ्ट का कहना है कि मॉडल को जल्द ही कोपायलट और बिंग इमेज क्रिएटर में पेश किया जाएगा।
Microsoft को MAI-Image-1 के फोटोरिअलिस्टिक उत्पादन मूल्यों और नियंत्रणीय प्रकाश व्यवस्था और बनावट पर विशेष रूप से गर्व है। कंपनी का विचार एआई छवियों की पेशकश करना था जो अन्य मॉडलों द्वारा बनाई गई छवियों की तरह नहीं दिखतीं, जो खुद को उन लोगों के लिए परिचित सामान्य सौंदर्य से अलग करती हैं जिन्होंने कई एआई छवियों को देखा है, विशेष रूप से ‘स्लॉप’ फॉर्म को सोशल मीडिया पर फैलते हुए देखा है।
मुख्य बात प्रशिक्षण डेटा को क्यूरेट करना और मॉडल को ट्यून करने के लिए पेशेवर क्रिएटिव के साथ काम करना था, इसका परीक्षण करना कि इसका उपयोग औसत व्यक्ति द्वारा कैसे किया जाएगा। माइक्रोसॉफ्ट को उम्मीद है कि एमएआई तुलनात्मक रूप से मिडजर्नी या स्टेबल डिफ्यूजन मॉडल को अनियमित और धीमा बना देगा।
माइक्रोसॉफ्ट की अपनी AI छवियां
माइक्रोसॉफ्ट अपनी हर चीज़ में एआई को शामिल करने में भारी निवेश कर रहा है, लेकिन इसका मतलब ज्यादातर ओपनएआई टूल्स है।
हालाँकि, अब यह बदल रहा है। MAI-Image-1 अब MAI‑1 और MAI‑Voice‑1 घरेलू भाषा और भाषण मॉडल में शामिल हो गया है। MAI‑Image‑1 अगला पहेली भाग है।
निःसंदेह, औसत व्यक्ति को इसमें से कुछ भी नज़र नहीं आएगा। प्रेजेंटेशन बनाते समय Microsoft PowerPoint का AI जो भी छवि बनाता है, उसे या तो वे पसंद करेंगे या उससे नाराज़ होंगे। कंपनी का कहना है कि यथार्थवाद और उपयोगिता पर उसके फोकस का मतलब है कि लोग काफी प्रसन्न होंगे। कम स्वप्न जैसी बूँदें और अधिक छवियां होंगी जो वास्तव में दस्तावेज़ों, विज्ञापनों और प्रस्तुतियों में काम करती हैं।
क्योंकि सवाल यह नहीं है कि “छवि मॉडल किसके पास है?” यह “किसके पास कोई उपयोगी उपकरण है जिसे लोग वास्तव में वास्तविक उपकरणों में उपयोग करेंगे?” यहीं पर Microsoft जुआ खेल रहा है कि MAI‑Image‑1 चमकेगा।
रचनात्मक पेशेवरों के लिए, इसका मतलब त्वरित से परिष्कृत अवधारणा तक का तेज़ रास्ता हो सकता है। रोजमर्रा के उपयोगकर्ताओं के लिए, इसका मतलब है विचार और कार्यान्वयन के बीच कम निराशाजनक अंतराल। और माइक्रोसॉफ्ट के लिए, यदि उपयोगकर्ता मॉडल को पसंद करते हैं, तो यह संपूर्ण एआई कोपायलट पारिस्थितिकी तंत्र को अधिक आकर्षक बनाता है। यदि यह विफल हो जाता है, तो इसे मदद के लिए OpenAI की ओर वापस जाने की आवश्यकता हो सकती है।
हालाँकि, अभी ऐसा लगता है कि Microsoft का OpenAI पर निर्भर होने का युग समाप्त हो गया है। एआई टूल्स का भविष्य इस बारे में होगा कि उन्हें कौन बनाता है और वे कहां दिखाई देते हैं, साथ ही वे वास्तव में क्या कर सकते हैं और वे किन समस्याओं का समाधान करते हैं। MAI‑Image‑1 के साथ, Microsoft कह रहा है कि वह उन सभी प्रश्नों का उत्तर स्वयं देना चाहता है।
Google समाचार पर TechRadar को फ़ॉलो करें और हमें पसंदीदा स्रोत के रूप में जोड़ें अपने फ़ीड में हमारे विशेषज्ञ समाचार, समीक्षाएं और राय प्राप्त करने के लिए। फॉलो बटन पर क्लिक करना सुनिश्चित करें!
और हां आप भी कर सकते हैं टिकटॉक पर TechRadar को फॉलो करें समाचारों, समीक्षाओं, वीडियो के रूप में अनबॉक्सिंग के लिए, और हमसे नियमित अपडेट प्राप्त करें WhatsApp बहुत।