New Delhi, le centre de recherche et de développement du géant coréen de l'électronique Samsung à Bangalore a développé le modèle d'IA en hindi pour Galaxy AI et a intensifié la technologie pour d'autres langues, notamment le thaï, le vietnamien et l'indonésien, a annoncé lundi la société.

Le Samsung R&D Institute India-Bengaluru (SRI-B) – le plus grand centre de recherche et développement de Samsung en dehors de la Corée – a collaboré avec des équipes du monde entier pour développer des modèles linguistiques d'IA pour l'anglais britannique, indien et australien également, a déclaré la société dans un communiqué. déclaration.

"SRI-B a développé la langue hindi pour Galaxy AI. Développer le modèle d'IA hindi n'a pas été simple. L'équipe a dû s'assurer que plus de 20 dialectes régionaux, inflexions tonales, ponctuations et expressions familières étaient couverts.

"De plus, il est courant que les locuteurs de l'hindi mélangent des mots anglais dans leurs conversations", indique le communiqué.

La société a déclaré que le développement du modèle hindi pour Galaxy AI a nécessité que l'équipe effectue plusieurs cycles de formation sur le modèle d'IA avec une combinaison de données traduites et translittérées.

"L'hindi a une structure phonétique complexe qui comprend des sons rétroflexes - des sons produits en recourbant la langue dans la bouche - qui ne sont pas présents dans de nombreuses autres langues.

"Pour créer l'élément de synthèse vocale de la solution d'IA, nous avons soigneusement examiné les données avec des linguistes natifs pour comprendre tous les sons uniques et créé un ensemble spécial de phénomènes pour prendre en charge des dialectes spécifiques de la langue", Giridhar Jakki, responsable de l'IA linguistique du SRI-B. dit.

À l'heure actuelle, plusieurs entreprises ont lancé des initiatives visant à développer des modèles d'IA pour les langues indiennes, l'hindi étant l'une des langues principales.

"L'Institut de technologie de Vellore a contribué à sécuriser près d'un million de lignes de données audio segmentées et organisées sur la parole, les mots et les commandes de conversation. Les données étaient un élément crucial pour une tâche aussi critique que l'intégration de la quatrième langue la plus parlée au monde dans Galaxy AI. Travailler avec des universités a permis à Samsung d'utiliser des données de la plus haute qualité", indique le communiqué.

SRI-B a également collaboré avec des équipes du monde entier pour développer des modèles linguistiques d'IA pour l'anglais britannique, indien et australien ainsi que pour le thaï, le vietnamien et l'indonésien.

Samsung qualifie sa plate-forme technologique d'IA de Galaxy AI.

Galaxy AI prend désormais en charge 16 langues, afin que davantage de personnes puissent étendre leurs capacités linguistiques même lorsqu'elles sont hors ligne, ajoute le communiqué.