कहने के लिए वंश का डेटाबेस विशाल है।
कंपनी के मुख्य प्रौद्योगिकी अधिकारी और उत्पाद और प्रौद्योगिकी के कार्यकारी उपाध्यक्ष श्रीराम थियागाज़ान ने बिजनेस इनसाइडर को बताया, “हमने 80 से अधिक देशों में 65 बिलियन से अधिक रिकॉर्ड एकत्र किए हैं।” “बस एक पैमाना देने के लिए, यह हमारे प्लेटफ़ॉर्म पर लगभग 10,000 टेराबाइट्स डेटा है जिसका उपयोग हम अपने उपयोगकर्ताओं को खोज प्रदान करने के लिए करते हैं।”
1983 में स्थापित यूटा-आधारित वंशावली कंपनी, लोगों को अपनी पारिवारिक जड़ों का पता लगाने में मदद करने के लिए रिकॉर्ड एकत्र करती है।
उन रिकॉर्डों में जन्म, मृत्यु, विवाह, जनगणना, सैन्य, भूमि, आव्रजन और समाचार पत्र शामिल हैं। ANCESTRY, जो उपभोक्ता डीएनए परीक्षण किट भी प्रदान करता है, उस डेटा को इकट्ठा करने के लिए राष्ट्रीय अभिलेखागार और रिकॉर्ड प्रशासन जैसे संस्थानों के साथ सहयोग करता है।
एक ट्रोव उस आकार के साथ एक चुनौतीपूर्ण चेतावनी है, हालांकि: इसे व्यवस्थित करना।
थियागराजन ने कहा कि वंश एआई और मशीन लर्निंग का लाभ उठा रहा है ताकि हरकुली टास्क को आसान बनाया जा सके।
कंप्यूटर विजन के साथ सुव्यवस्थित
जब वह 2017 में पूर्वजों की टीम में शामिल हुए, तो थियागराजन ने कहा कि कंपनी ने अभी -अभी एआई और मशीन लर्निंग की खोज शुरू की है।
“हम उन सामग्री को डिजिटाइज़ करने के लिए एक प्रभावी और कुशल तरीके का पता लगाने की कोशिश कर रहे थे जो हम दुनिया भर से प्राप्त करते हैं,” थियागराजन ने कहा।
ANCESTRY रिकॉर्ड को स्कैन करने के लिए उपयोग किया जाता है, फिर मैन्युअल रूप से इंडेक्स और प्रमुख प्रासंगिक क्षेत्रों के लिए संचालन को आउटसोर्स करता है। सॉफ्टवेयर कार्यक्रमों को लोगों, स्थानों या अन्य श्रेणियों के बीच संबंध स्थापित करने से पहले उस जानकारी को पूर्वजों के डेटाबेस में अपलोड किया गया था।
“लगभग 15 या 20 साल पहले, जब हमने 1940 की जनगणना को डिजिटल किया था, तो हमें लागत में 10 गुना मैनुअल तरीके से इसे करने में लगभग नौ महीने लग गए।”
इसने उत्तर की तलाश में वंश टीम को भेजा।
“हमने कहा, ‘हम मैनुअल हस्तक्षेप के बिना सामग्री को स्वचालित रूप से डिजिटाइज़ करने के लिए कंप्यूटर विजन एआई तकनीकों को क्यों नहीं लागू करते हैं?” थियागराजन ने कहा, “2021 की समय सीमा के लिए तेजी से, हमने अपने स्वयं के मालिकाना लिखावट मान्यता कंप्यूटर विजन प्रौद्योगिकियों का उपयोग किया, और हमने लागत के एक अंश पर नौ महीने से नौ दिनों से कम समय तक बाजार को संकुचित कर दिया।”
थियागराजन ने कहा कि वंश ने तब से उस तकनीक का विस्तार किया है जो अन्य रिकॉर्ड प्रकारों को संसाधित करने के लिए है, लेकिन कहा कि मनुष्य अभी भी एआई परिणामों की समीक्षा करता है “आवश्यकतानुसार”।
“हमने कुछ स्वचालित नियंत्रण और प्रणालियां बनाई हैं जो निश्चित रूप से समय की मात्रा को कम करते हैं, हमें जाँच खर्च करने की आवश्यकता है,” उन्होंने कहा। “हम यह सुनिश्चित करने में अतिरिक्त सावधान रहना चाहते हैं कि हम एआई का उपयोग करके जो कुछ भी पैदा करते हैं, वह सच में है। तथ्यों में ग्राउंडेड।”
थियागराजन ने कहा कि “जिस हद तक हम इसे अब कुछ साल पहले करते हैं, वह निश्चित रूप से सुधार हुआ है।”
“दिन के अंत में, जब उपभोक्ता हमारे मंच पर अपने पूर्वजों के बारे में कहानियों की तलाश में आते हैं, तो हम उन्हें उन रिकॉर्डों से जोड़ना चाहते हैं जो हम पाते हैं,” उन्होंने कहा।
ANCESTRY बीटा एक नई AI सुविधा का परीक्षण कर रहा है
AI को बैकएंड में लागू करने के अलावा, Ancestry ने उपयोगकर्ताओं के लिए कई सुविधाओं को तैनात किया है, जिसमें इसके लिखावट मान्यता उपकरण भी शामिल है। इसने 2024 में एआई सहायक का परीक्षण शुरू किया।
हाल ही में, थियागराजन ने बिजनेस इनसाइडर को बताया कि वंश ने बीटा का परीक्षण शुरू किया, जो ऑडियो स्टोरीज नामक एक एआई-संचालित फीचर का परीक्षण करना शुरू कर देता है जो उपयोगकर्ताओं को रिकॉर्ड को एक कथा ऑडियो में बदलने की अनुमति देता है।
“एआई मुद्रित सामग्री, छवि, और हस्तलिखित कथा के बीच के संदर्भ को समझ सकता है, और इसे एक साथ एक कहानी में एक साथ बाँध सकता है,” थियागराजान ने कहा।
हालाँकि अभी तक ऑडियो कहानियों के लिए कोई आधिकारिक लॉन्च की तारीख नहीं है, लेकिन ANCESTRY पहले से ही ऑडियो के ऊपर और परे सोच रहा है।
“नीचे सड़क, हम दृष्टि, ध्वनि, गति और वीडियो कहानी को जोड़ने में सक्षम होना चाहते हैं,” थियागराजन ने कहा।