शॉर्टकट और जोखिम लेने के लिए, लोरेंजो सैन फ्रांसिस्को-आधारित कंपनी Dronedeploy के लिए एक उपकरण पर काम कर रहा है, जो सॉफ्टवेयर बेचता है जो वीडियो और छवियों से काम की प्रगति के दैनिक डिजिटल मॉडल बनाता है, जिसे व्यापार में “रियलिटी कैप्चर” के रूप में जाना जाता है। सुरक्षा एआई नामक उपकरण, प्रत्येक दिन की वास्तविकता कैप्चर इमेजरी और झंडे की स्थिति का विश्लेषण करता है जो व्यावसायिक सुरक्षा और स्वास्थ्य प्रशासन (OSHA) नियमों का उल्लंघन करते हैं, जो वह दावा करता है कि वह 95% सटीकता है।
इसका मतलब है कि किसी भी सुरक्षा जोखिम के लिए सॉफ्टवेयर झंडे, 95% निश्चितता है कि ध्वज सटीक है और एक विशिष्ट OSHA विनियमन से संबंधित है। अक्टूबर 2024 में लॉन्च किया गया, अब इसे अमेरिका में सैकड़ों निर्माण स्थलों पर तैनात किया जा रहा है, लोरेंजो कहते हैं, और कनाडा, यूके, दक्षिण कोरिया और ऑस्ट्रेलिया सहित देशों में भवन नियमों के लिए विशिष्ट संस्करण भी तैनात किए गए हैं।
सुरक्षा एआई कई एआई निर्माण सुरक्षा उपकरणों में से एक है जो हाल के वर्षों में सिलिकॉन वैली से हांगकांग से जेरूसलम तक उभरा है। इनमें से कई मानव “क्लिकर्स” की टीमों पर भरोसा करते हैं, जो अक्सर कम-मजदूरी वाले देशों में हैं, एक एल्गोरिथ्म को प्रशिक्षित करने के लिए डेटा के बड़े संस्करणों को लेबल करने के लिए, सीढ़ी जैसी प्रमुख वस्तुओं की छवियों के आसपास बाउंडिंग बॉक्स को मैन्युअल रूप से आकर्षित करने के लिए।
लोरेंजो का कहना है कि सुरक्षा एआई पहले एक है जो जेनेरिक एआई का उपयोग सुरक्षा उल्लंघनों को ध्वजांकित करने के लिए है, जिसका अर्थ है कि एक एल्गोरिथ्म जो कि सीढ़ी या हार्ड टोपी जैसी वस्तुओं को पहचानने से अधिक कर सकता है। सॉफ्टवेयर किसी साइट की छवि में क्या चल रहा है, इसके बारे में “कारण” कर सकता है और इस बारे में एक निष्कर्ष निकाल सकता है कि क्या कोई OSHA उल्लंघन है। यह ऑब्जेक्ट डिटेक्शन की तुलना में विश्लेषण का एक अधिक उन्नत रूप है जो वर्तमान उद्योग मानक है, लोरेंजो का दावा है। लेकिन जैसा कि 95% सफलता दर से पता चलता है, सुरक्षा एआई एक निर्दोष और सभी जानने वाली बुद्धिमत्ता नहीं है। इसे ओवरसियर के रूप में एक अनुभवी सुरक्षा निरीक्षक की आवश्यकता होती है।
वास्तविक दुनिया में एक दृश्य भाषा मॉडल
रोबोट और एआई कारखाने के फर्श या शिपिंग टर्मिनलों की तरह नियंत्रित, बड़े पैमाने पर स्थिर वातावरण में पनपते हैं। लेकिन निर्माण स्थल, परिभाषा के अनुसार, हर दिन थोड़ा सा बदलते हैं।
लोरेंजो को लगता है कि उन्होंने साइटों की निगरानी करने का एक बेहतर तरीका बनाया है, एक प्रकार के जेनेरिक एआई का उपयोग करके एक दृश्य भाषा मॉडल, या वीएलएम कहा जाता है। एक वीएलएम एक विज़न एनकोडर के साथ एक एलएलएम है, जो इसे दुनिया की छवियों को “देखने” की अनुमति देता है और विश्लेषण करता है कि दृश्य में क्या चल रहा है।
रियलिटी कैप्चर इमेजरी के वर्षों का उपयोग करते हुए ग्राहकों से इकट्ठा हुए, उनकी स्पष्ट अनुमति के साथ, लोरेंजो की टीम ने इकट्ठा किया है कि वह “गोल्डन डेटा सेट” को ओएसएचए उल्लंघनों की हजारों चित्रों को शामिल करते हुए “गोल्डन डेटा सेट” कहता है। वर्षों से इस विशिष्ट डेटा को सावधानीपूर्वक स्टॉक करने के बाद, वह चिंतित नहीं है कि यहां तक कि एक अरब-डॉलर की तकनीक दिग्गज भी उसे “कॉपी और क्रश” करने में सक्षम होंगे।
मॉडल को प्रशिक्षित करने में मदद करने के लिए, लोरेंजो के पास निर्माण सुरक्षा पेशेवरों की एक छोटी टीम है जो एआई के रणनीतिक प्रश्न पूछते हैं। ट्रेनर्स इनपुट टेस्ट सीन गोल्डन डेटा से वीएलएम को सेट करते हैं और ऐसे प्रश्न पूछते हैं जो दृश्य को तोड़ने की प्रक्रिया के माध्यम से मॉडल का मार्गदर्शन करते हैं और इसे एक अनुभवी मानव के तरीके से कदम उठाते हैं। यदि वीएलएम सही प्रतिक्रिया उत्पन्न नहीं करता है – उदाहरण के लिए, यह एक उल्लंघन को याद करता है या एक गलत सकारात्मक पंजीकृत करता है – मानव प्रशिक्षक वापस जाते हैं और संकेतों या इनपुट को ट्विस्ट करते हैं। लोरेंजो का कहना है कि केवल वस्तुओं को पहचानने के लिए सीखने के बजाय, वीएलएम को “एक निश्चित तरीके से कैसे सोचें,” सिखाया जाता है, जिसका अर्थ है कि यह एक छवि में क्या हो रहा है, इसके बारे में सूक्ष्म निष्कर्ष निकाल सकता है।