होम व्यापार एक एआई डेटा ट्रैप Google को प्रतिरूपित करता है

एक एआई डेटा ट्रैप Google को प्रतिरूपित करता है

3
0

यदि आप AI में सफल होना चाहते हैं, तो एक अच्छा हैक Google को प्रतिरूपित करना होगा। आप बस पकड़ नहीं सकते।

यह वही है जो सिर्फ पेरप्लेक्सिटी के लिए हुआ, एक स्टार्टअप जो चैट, Google की मिथुन और अन्य जनरेटिव एआई सेवाओं के साथ प्रतिस्पर्धा करता है।

एआई में सफलता के लिए गुणवत्ता डेटा महत्वपूर्ण है, लेकिन टेक कंपनियां इसके लिए भुगतान नहीं करना चाहती हैं, इसलिए वे वेब को क्रॉल करें और बिना किसी अनुमति के मुफ्त में मुफ्त में जानकारी को परिमार्जन करते हैं। इसने कुछ सामग्री रचनाकारों और अन्य लोगों द्वारा एक बैकलैश को उकसाया है जो वेब का निर्माण करने वाले प्रोत्साहन को संरक्षित करने में रुचि रखते हैं।

क्लाउडफ्लारे और इसके सीईओ, मैथ्यू प्रिंस ने इस लड़ाई में नई सुविधाओं के साथ तूफान ला दिया है जो वेबसाइटों को अवांछित एआई बॉट क्रॉलर को ब्लॉक करने में मदद करता है। CloudFlare एक बुनियादी ढांचा, सुरक्षा और सॉफ्टवेयर कंपनी है जो इंटरनेट के लगभग 20% को चलाने में मदद करती है। यह तब पनपता है जब वेब अच्छा करता है, इसलिए साइटों को सामग्री के लिए भुगतान करने में मदद करने में इसकी रुचि होती है।

कुछ CloudFlare ग्राहकों ने हाल ही में कंपनी से शिकायत की कि Perplexity इन ब्लॉकों को विकसित कर रहा था और बिना अनुमति के डेटा को खुरचने और एकत्र करना जारी रखा।

इसलिए, क्लाउडफ्लारे ने एक डिजिटल जाल सेट किया और इस स्टार्टअप को लाल-हाथ से पकड़ा, सोमवार के एक ब्लॉग के अनुसार एस्केपेड का वर्णन किया।

प्रिंस ने सोमवार को एक्स पर लिखा, “कुछ कथित तौर पर ‘प्रतिष्ठित’ एआई कंपनी उत्तर कोरियाई हैकर्स की तरह काम करती हैं।” “नाम, शर्म, और हार्ड उन्हें ब्लॉक करने का समय।”

Perplexity ने टिप्पणी के लिए एक अनुरोध का जवाब नहीं दिया।

चारा: हनीट्रैप डोमेन और बंद दरवाजे

CloudFlare ने पूरी तरह से नई, अप्रकाशित वेबसाइटें बनाईं और उन्हें रोबोट के साथ कॉन्फ़िगर किया। चंचल और अशिष्टता। इन परीक्षण साइटों में कोई सार्वजनिक लिंक, खोज इंजन प्रविष्टियाँ या मेटाडेटा नहीं था जो सामान्य रूप से उन्हें खोज योग्य बना देगा।

फिर भी, जब CloudFlare ने इन विशिष्ट साइटों के बारे में सवालों के साथ Perplexity के AI को चुटकी ली, तो स्टार्टअप की सेवा ने विस्तृत जानकारी के साथ जवाब दिया जो केवल उन प्रतिबंधित पृष्ठों से आ सकता था। निष्कर्ष? स्पष्ट रूप से नहीं बताए जाने के बावजूद Perplexity ने सामग्री को एक्सेस किया था।

द क्लोक: हाउ पेरप्लेक्सिटी ने अपने क्रॉल को कैसे मास्क किया

Perplexity ने शुरू में अपने आधिकारिक उपयोगकर्ता-एजेंट स्ट्रिंग का उपयोग करके इन साइटों को क्रॉल किया, मानक प्रोटोकॉल का अनुपालन किया। हालांकि, क्लाउडफ्लारे ने कहा कि यह पता चला है कि एक बार अवरुद्ध होने के बाद, पेरप्लेक्सिटी ने चुपके रणनीति का सहारा लिया।

CloudFlare ने पाया कि Perplexity ने सामान्य वेब ब्राउज़रों के रूप में प्रच्छन्न अघोषित क्रॉलर को तैनात करना शुरू कर दिया और अज्ञात या घुमाए गए आईपी पते और अनौपचारिक ASNs से अनुरोध भेजे, जो महत्वपूर्ण पहचानकर्ता हैं जो इंटरनेट ट्रैफ़िक को कुशलता से रूट करने में मदद करते हैं।

जब इसके आधिकारिक क्रॉलर को अवरुद्ध कर दिया गया था, तो Perplexity ने Apple Mac कंप्यूटर पर Google के क्रोम ब्राउज़र को लागू करने के लिए डिज़ाइन किए गए एक सामान्य वेब ब्राउज़र का भी उपयोग किया। (बिजनेस इनसाइडर ने Google से पूछा कि क्या इसने क्रोम को रोकने के लिए कहा है। Google ने जवाब नहीं दिया)।

CloudFlare के अनुसार, Perplexity हजारों वेब डोमेन में रोजाना इस तरह के “स्टील्थ” अनुरोधों के लाखों लोग कर रहे हैं।

इस व्यवहार ने न केवल वेब मानकों का उल्लंघन किया, बल्कि उन मौलिक ट्रस्ट को भी धोखा दिया, जो खुले वेब के कामकाज को कम करते हैं, क्लाउडफ्लेर ने समझाया।

तुलना: ओपनई कैसे सही हो जाता है

इस बात पर जोर देने के लिए कि अच्छा बॉट व्यवहार कैसा दिखता है, क्लाउडफ्लेयर ने ओपनई के क्रॉलर के आचरण की तुलना की, जो कि आगामी जीपीटी -5 जैसे चैट और दिग्गज एआई मॉडल विकसित करने के लिए डेटा को परिमार्जन करता है।

जब Openai के बॉट्स को एक रोबोट.टैक्स फ़ाइल या एक समान ब्लॉक का सामना करना पड़ा, तो वे बस वापस बंद हो गए। कोई परिधि नहीं। कोई मास्किंग नहीं। CloudFlare परीक्षणों के अनुसार, कोई भी बैकडोर रेंगना नहीं।

द फॉलआउट: डी-वेरिफिकेशन एंड ब्लॉकिंग

इन निष्कर्षों के परिणामस्वरूप, CloudFlare ने एक सत्यापित बॉट के रूप में डी-लिस्टेड पेरप्लेक्सिटी की है और अपने नेटवर्क में नई पहचान और अवरुद्ध तकनीकों को रोल आउट किया है।

AI हथियारों की दौड़ में CloudFlare का टेकडाउन एक सावधानी से काम करता है। जबकि वेब डेटा एक्सेस और उपयोग पर मजबूत नियंत्रण की ओर बढ़ता है, इन विकसित होने वाले मानदंडों में भाग लेने वाले अभिनेता खुद को न केवल अवरुद्ध कर सकते हैं, बल्कि सार्वजनिक रूप से बाहर बुलाए जाते हैं।

एक ऐसे युग में जहां एआई सिस्टम प्रशिक्षण डेटा के लिए भूखे हैं, क्लाउडफ्लारे का स्टिंग ऑपरेशन स्टार्टअप्स और स्थापित खिलाड़ियों के लिए एक संकेत है: वेब के नियमों का सम्मान करें, या जोखिम को उजागर किया जा रहा है।

बीआई के टेक मेमो न्यूज़लेटर के लिए साइन अप करें यहाँ। ईमेल के माध्यम से मेरे पास पहुंचें abarr@businessinsider.com

स्रोत लिंक

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें