जबकि O1 एक प्रमुख तकनीकी प्रगति थी, GPT-5, सभी से ऊपर, एक परिष्कृत उत्पाद। एक प्रेस ब्रीफिंग के दौरान, सैम अल्टमैन ने GPT-5 की तुलना Apple के रेटिना डिस्प्ले से की, और यह एक उपयुक्त सादृश्य है, हालांकि शायद उस तरह से नहीं था जिस तरह से वह इरादा करता था। एक अभूतपूर्व कुरकुरा स्क्रीन की तरह, GPT-5 एक अधिक सुखद और सहज उपयोगकर्ता अनुभव प्रस्तुत करेगा। यह कुछ भी नहीं है, लेकिन यह परिवर्तनकारी एआई भविष्य से बहुत कम है कि अल्टमैन ने पिछले साल की हाइपिंग में ज्यादा खर्च किया है। ब्रीफिंग में, Altman ने GPT-5 को “AGI के मार्ग के साथ एक महत्वपूर्ण कदम,” या कृत्रिम सामान्य बुद्धिमत्ता कहा, और शायद वह सही है-लेकिन यदि ऐसा है, तो यह एक बहुत छोटा कदम है।
Openai ने दिखाए गए मॉडल की क्षमताओं का डेमो लें एमआईटी प्रौद्योगिकी समीक्षा इसकी रिहाई से पहले। Openai में एक पोस्ट-ट्रेनिंग लीड यान डुबोइस ने GPT-5 को एक वेब एप्लिकेशन डिजाइन करने के लिए कहा, जो उसके साथी को फ्रेंच सीखने में मदद करेगा ताकि वह अपने परिवार के साथ अधिक आसानी से संवाद कर सके। मॉडल ने अपने निर्देशों का पालन करने का एक सराहनीय काम किया और एक आकर्षक, उपयोगकर्ता के अनुकूल ऐप बनाया। लेकिन जब मैंने GPT-4O को लगभग समान संकेत दिया, तो इसने बिल्कुल उसी कार्यक्षमता के साथ एक ऐप का उत्पादन किया। अंतर केवल इतना है कि यह सौंदर्यशास्त्र के रूप में मनभावन नहीं था।
कुछ अन्य उपयोगकर्ता-अनुभव सुधार अधिक पर्याप्त हैं। उपयोगकर्ता के बजाय मॉडल होने का चयन करें कि क्या प्रत्येक क्वेरी के लिए तर्क लागू करना है, एक प्रमुख दर्द बिंदु को हटा देता है, विशेष रूप से उन उपयोगकर्ताओं के लिए जो एलएलएम प्रगति का बारीकी से पालन नहीं करते हैं।
और, अल्टमैन के अनुसार, जीपीटी -5 ओ-सीरीज़ मॉडल की तुलना में बहुत तेज हैं। तथ्य यह है कि Openai इसे गैर -भुगतान करने वाले उपयोगकर्ताओं को जारी कर रहा है, यह बताता है कि कंपनी के लिए यह भी कम खर्चीला है। यह एक बड़ी बात है: सस्ते और जल्दी से शक्तिशाली मॉडल चलाना एक कठिन समस्या है, और इसे हल करना एआई के पर्यावरणीय प्रभाव को कम करने के लिए महत्वपूर्ण है।
Openai ने मतिभ्रम को कम करने के लिए भी कदम उठाए हैं, जो लगातार सिरदर्द रहा है। Openai के मूल्यांकन से पता चलता है कि GPT-5 मॉडल अपने पूर्ववर्ती मॉडल, O3 और GPT-4O की तुलना में गलत दावे करने की काफी कम संभावना रखते हैं। यदि वह उन्नति जांच के लिए रखती है, तो यह अधिक विश्वसनीय और भरोसेमंद एजेंटों के लिए मार्ग प्रशस्त करने में मदद कर सकती है। यूसी बर्कले में कंप्यूटर विज्ञान के प्रोफेसर डॉन सॉन्ग कहते हैं, “मतिभ्रम वास्तविक सुरक्षा और सुरक्षा मुद्दों का कारण बन सकता है।” उदाहरण के लिए, एक एजेंट जो सॉफ़्टवेयर पैकेजों को मतिभ्रम करता है, वह उपयोगकर्ता के डिवाइस में दुर्भावनापूर्ण कोड डाउनलोड कर सकता है।
GPT-5 ने कई बेंचमार्क पर कला की स्थिति को प्राप्त किया है, जिसमें एजेंटिक क्षमताओं का परीक्षण और कोडिंग मूल्यांकन SWE-Bench और Aider पॉलीग्लॉट शामिल हैं। लेकिन कंपनी के हगिंगफेस में एआई शोधकर्ता, क्लेमेंटिन फोरियर के अनुसार, वे मूल्यांकन संतृप्ति के करीब हैं, जिसका अर्थ है कि वर्तमान मॉडल ने अधिकतम प्रदर्शन के करीब हासिल किया है।
“यह मूल रूप से मध्यम-ग्रेड की समस्याओं पर एक हाई स्कूलर के प्रदर्शन को देखने जैसा है,” वह कहती हैं। “अगर हाई स्कूलर विफल हो जाता है, तो यह आपको कुछ बताता है, लेकिन अगर यह सफल होता है, तो यह आपको बहुत कुछ नहीं बताता है।” फोरियर ने कहा कि वह प्रभावित होगी यदि सिस्टम ने SWE-Bench पर 80% या 85% का स्कोर हासिल किया-लेकिन यह केवल 74.9% का प्रबंधन करता है।
अंततः, Openai का शीर्षक संदेश यह है कि GPT-5 का उपयोग करना बेहतर लगता है। “इस मॉडल के वाइब्स वास्तव में अच्छे हैं, और मुझे लगता है कि लोग वास्तव में ऐसा महसूस करने जा रहे हैं, विशेष रूप से औसत ऐसे लोग जो मॉडल के बारे में अपना समय नहीं बिता रहे हैं,” निक टर्ले ने कहा, चैट के प्रमुख निक टर्ले ने कहा।
अकेले वाइब्स, हालांकि, स्वचालित भविष्य के बारे में नहीं लाएंगे जो अल्टमैन ने वादा किया था। तर्क को एजीआई के रास्ते में एक प्रमुख कदम की तरह लगा। हम अभी भी अगले एक की प्रतीक्षा कर रहे हैं।