Neu-Delhi: Das Forschungs- und Entwicklungszentrum des koreanischen Elektronikriesen Samsung in Bengaluru hat das Hindi-KI-Modell für Galaxy AI entwickelt und die Technologie für einige andere Sprachen, darunter Thailändisch, Vietnamesisch und Indonesisch, ausgebaut, teilte das Unternehmen am Montag mit.

Das Samsung R&D Institute India-Bengaluru (SRI-B) – Samsungs größtes Forschungs- und Entwicklungszentrum außerhalb Koreas – arbeitete mit Teams auf der ganzen Welt zusammen, um KI-Sprachmodelle auch für britisches, indisches und australisches Englisch zu entwickeln, teilte das Unternehmen in einem mit Stellungnahme.

„SRI-B hat die Hindi-Sprache für Galaxy AI entwickelt. Die Entwicklung des Hindi-KI-Modells war nicht einfach. Das Team musste sicherstellen, dass mehr als 20 regionale Dialekte, Tonarten, Zeichensetzung und Umgangssprache abgedeckt wurden.“

„Außerdem ist es bei Hindi-Sprechern üblich, in ihren Gesprächen englische Wörter zu vermischen“, heißt es in der Erklärung.

Das Unternehmen sagte, dass die Entwicklung des Hindi-Modells für Galaxy AI das Team dazu zwingen müsse, mehrere Runden des KI-Modelltrainings mit einer Kombination aus übersetzten und transliterierten Daten durchzuführen.

„Hindi hat eine komplexe phonetische Struktur, die retroflexe Laute umfasst – Laute, die durch das Zurückrollen der Zunge im Mund entstehen –, die in vielen anderen Sprachen nicht vorkommen.

„Um das Sprachsyntheseelement der KI-Lösung aufzubauen, haben wir die Daten sorgfältig mit muttersprachlichen Linguisten überprüft, um alle einzigartigen Laute zu verstehen, und einen speziellen Satz von Phänomenen erstellt, um bestimmte Dialekte der Sprache zu unterstützen“, sagt Giridhar Jakki, Leiter der Sprach-KI bei SRI-B sagte.

Derzeit haben mehrere Unternehmen Initiativen zur Entwicklung von KI-Modellen für indische Sprachen gestartet, wobei Hindi eine der Hauptsprachen ist.

„Das Vellore Institute of Technology hat dazu beigetragen, fast eine Million Zeilen segmentierter und kuratierter Audiodaten zu Gesprächssprache, Wörtern und Befehlen zu sichern. Daten waren eine entscheidende Komponente für eine so wichtige Aufgabe wie die Integration der am vierthäufigsten gesprochenen Sprache der Welt in Galaxy AI.“ Durch die Zusammenarbeit mit Universitäten wurde sichergestellt, dass Samsung Daten von höchster Qualität verwendet“, heißt es in der Erklärung.

SRI-B arbeitete außerdem mit Teams auf der ganzen Welt zusammen, um KI-Sprachmodelle für britisches, indisches und australisches Englisch sowie Thailändisch, Vietnamesisch und Indonesisch zu entwickeln.

Samsung bezeichnet seine KI-Technologieplattform als Galaxy AI.

Galaxy AI unterstützt jetzt 16 Sprachen, sodass mehr Menschen ihre Sprachfähigkeiten auch offline erweitern können, heißt es in der Erklärung weiter.