Openai का नवीनतम प्रायोगिक मॉडल एक गणित Whiz है, जो एक कठिन मुश्किल गणित परीक्षा में इतना अच्छा प्रदर्शन कर रहा है कि हर कोई अब इसके बारे में बात कर रहा है।
“मैं यह साझा करने के लिए उत्साहित हूं कि हमारे नवीनतम @openai प्रायोगिक तर्क LLM ने AI: दुनिया की सबसे प्रतिष्ठित गणित प्रतियोगिता-अंतर्राष्ट्रीय गणित ओलंपियाड (IMO) पर स्वर्ण पदक-स्तरीय प्रदर्शन में एक लंबे समय से भव्य चुनौती हासिल की है,” ओपनईई के तकनीकी कर्मचारियों के एक सदस्य अलेक्जेंडर वेई ने एक्स पर कहा।
अंतर्राष्ट्रीय गणित ओलंपियाड एक वैश्विक प्रतियोगिता है जो 1959 में रोमानिया में शुरू हुई थी और अब इसे दुनिया में सबसे कठिन माना जाता है। इसे दो दिनों में विभाजित किया जाता है, जिसके दौरान प्रतिभागियों को साढ़े चार घंटे की परीक्षा दी जाती है, जिनमें से प्रत्येक में तीन प्रश्न होते हैं। कुछ प्रसिद्ध विजेताओं में ग्रिगोरी पेरेलमैन शामिल हैं, जिन्होंने एडवांस ज्यामिति, और टेरेंस ताओ, फील्ड्स मेडल के प्राप्तकर्ता, गणित में सर्वोच्च सम्मान प्राप्त करने में मदद की।
जून में, ताओ ने लेक्स फ्रिडमैन के पॉडकास्ट पर भविष्यवाणी की कि एआई आईएमओ पर उच्च स्कोर नहीं करेगा। उन्होंने सुझाव दिया कि शोधकर्ताओं ने थोड़ा कम शूट किया। उन्होंने कहा, “छोटी प्रतियोगिताएं हैं। ऐसी प्रतियोगिताएं हैं जहां उत्तर एक लंबे समय के प्रमाण के बजाय एक संख्या है,” उन्होंने कहा।
फिर भी Openai के नवीनतम मॉडल ने समस्याओं में से छह में से पांच को सही ढंग से हल किया, मनुष्यों के समान परीक्षण स्थितियों के तहत काम करते हुए, वेई ने कहा।
वेई के सहयोगी, नोआम ब्राउन ने कहा कि मॉडल ने परीक्षा के दौरान धीरज का एक नया स्तर प्रदर्शित किया।
“IMO समस्याएं पिछले बेंचमार्क की तुलना में निरंतर रचनात्मक सोच के एक नए स्तर की मांग करती हैं,” उन्होंने कहा। “यह मॉडल एक के लिए सोचता है लंबा समय।”
वी ने कहा कि मॉडल सामान्य बुद्धि में एक उन्नयन है। मॉडल का प्रदर्शन “सामान्य-उद्देश्य सुदृढीकरण सीखने में नई जमीन को तोड़ रहा है,” उन्होंने कहा। DeepMind की अल्फैगोमेट्री, इसके विपरीत, विशेष रूप से केवल गणित करने के लिए डिज़ाइन किया गया है।
“यह एक एलएलएम गणित कर रहा है न कि एक विशिष्ट औपचारिक गणित प्रणाली; यह सामान्य बुद्धिमत्ता की ओर हमारे मुख्य धक्का का हिस्सा है,” अल्टमैन ने एक्स पर कहा।
“जब हमने पहली बार Openai शुरू किया, तो यह एक सपना था, लेकिन ऐसा नहीं था जो हमें बहुत यथार्थवादी महसूस करता था; यह एक महत्वपूर्ण मार्कर है कि पिछले एक दशक में AI कितनी दूर आया है,” Altman ने IOM में मॉडल के प्रदर्शन का जिक्र करते हुए लिखा।
अल्टमैन ने कहा कि “कई महीनों के लिए” सोने के स्तर की क्षमता “के साथ एक मॉडल जनता के लिए उपलब्ध नहीं होगा।
उपलब्धि इस बात का एक उदाहरण है कि तकनीक कितनी तेजी से विकसित हो रही है। ब्राउन ने कहा कि पिछले साल, “एआई लैब्स ग्रेड स्कूल मैथ का उपयोग कर रहे थे” मॉडल का मूल्यांकन करने के लिए, ब्राउन ने कहा। और टेक अरबपति पीटर थिएल ने कहा कि पिछले साल एआई के गणित ओलंपियाड समस्याओं को हल करने से पहले कम से कम तीन साल लगेंगे।
फिर भी, हमेशा संदेह होता है।
एआई हाइप के एक प्रसिद्ध आलोचक गैरी मार्कस ने एक्स पर मॉडल के प्रदर्शन को “वास्तविक रूप से प्रभावशाली” कहा, लेकिन उन्होंने यह भी कहा कि मॉडल को कैसे प्रशिक्षित किया गया था, इसकी “सामान्य बुद्धिमत्ता” का दायरा, सामान्य आबादी के लिए उपयोगिता और प्रति समस्या लागत। मार्कस ने यह भी कहा कि IMO ने स्वतंत्र रूप से इन परिणामों को सत्यापित नहीं किया है।