नई दिल्ली, कोरियाई इलेक्ट्रॉनिक्स दिग्गज सैमसंग के बेंगलुरु स्थित अनुसंधान और विकास केंद्र ने गैलेक्सी एआई के लिए हिंदी एआई मॉडल विकसित किया है और थाई, वियतनामी और इंडोनेशियाई सहित कुछ अन्य भाषाओं के लिए प्रौद्योगिकी को विकसित किया है, कंपनी ने सोमवार को कहा।

सैमसंग आर एंड डी इंस्टीट्यूट इंडिया-बेंगलुरु (एसआरआई-बी) - कोरिया के बाहर सैमसंग का सबसे बड़ा अनुसंधान और विकास केंद्र - ने ब्रिटिश, भारतीय और ऑस्ट्रेलियाई अंग्रेजी के लिए एआई भाषा मॉडल विकसित करने के लिए दुनिया भर की टीमों के साथ सहयोग किया है, कंपनी ने एक में कहा कथन।

"एसआरआई-बी ने गैलेक्सी एआई के लिए हिंदी भाषा विकसित की। हिंदी एआई मॉडल विकसित करना आसान नहीं था। टीम को 20 से अधिक क्षेत्रीय बोलियों, तानवाला विभक्तियों, विराम चिह्न और बोलचाल को सुनिश्चित करना था।

बयान में कहा गया है, "इसके अलावा, हिंदी बोलने वालों के लिए अपनी बातचीत में अंग्रेजी शब्दों का मिश्रण करना आम बात है।"

कंपनी ने कहा कि गैलेक्सी एआई के लिए हिंदी मॉडल विकसित करने के लिए टीम को अनुवादित और लिप्यंतरित डेटा के संयोजन के साथ एआई मॉडल प्रशिक्षण के कई दौर आयोजित करने की आवश्यकता है।

"हिंदी में एक जटिल ध्वन्यात्मक संरचना है जिसमें रेट्रोफ़्लेक्स ध्वनियाँ शामिल हैं - जीभ को मुँह में वापस घुमाकर बनाई गई ध्वनियाँ - जो कई अन्य भाषाओं में मौजूद नहीं हैं।

एसआरआई-बी के भाषा प्रमुख एआई गिरिधर जक्की ने कहा, "एआई समाधान के भाषण संश्लेषण तत्व के निर्माण के लिए, हमने सभी अद्वितीय ध्वनियों को समझने के लिए देशी भाषाविदों के साथ डेटा की सावधानीपूर्वक समीक्षा की और भाषा की विशिष्ट बोलियों का समर्थन करने के लिए फिनोम का एक विशेष सेट बनाया।" कहा।

वर्तमान में, कई कंपनियों ने भारतीय भाषाओं के लिए एआई मॉडल विकसित करने की पहल शुरू कर दी है, जिसमें हिंदी एक प्रमुख भाषा है।

"वेल्लोर इंस्टीट्यूट ऑफ टेक्नोलॉजी ने बातचीत के भाषण, शब्दों और आदेशों पर खंडित और क्यूरेटेड ऑडियो डेटा की लगभग दस लाख पंक्तियों को सुरक्षित करने में मदद की। दुनिया में चौथी सबसे अधिक बोली जाने वाली भाषा को गैलेक्सी एआई में शामिल करने जैसे महत्वपूर्ण कार्य के लिए डेटा एक महत्वपूर्ण घटक था। विश्वविद्यालयों के साथ काम करके यह सुनिश्चित किया गया कि सैमसंग उच्चतम गुणवत्ता वाले डेटा का उपयोग कर रहा है," बयान में कहा गया है।

एसआरआई-बी ने ब्रिटिश, भारतीय और ऑस्ट्रेलियाई अंग्रेजी के साथ-साथ थाई, वियतनामी और इंडोनेशियाई के लिए एआई भाषा मॉडल विकसित करने के लिए दुनिया भर की टीमों के साथ भी सहयोग किया।

सैमसंग अपने AI प्रौद्योगिकी प्लेटफॉर्म को गैलेक्सी AI के रूप में ब्रांड करता है।

बयान में कहा गया है कि गैलेक्सी एआई अब 16 भाषाओं का समर्थन करता है, इसलिए ऑफ़लाइन होने पर भी अधिक लोग अपनी भाषा क्षमताओं का विस्तार कर सकते हैं।