Santander, 20 de octubre (Portaltic/EP) –
Meta aseguró que está desarrollando una tecnología basada en Inteligencia Artificial (IA) capaz de traducir idiomas que no cuentan con gramática y ortografía oficiales, es decir, lenguas no escritas.
La compañía adelantó el desarrollo de su proyecto Universal Speech Translator (UST), con el que busca crear un modelo de traducción en tiempo real en todos los idiomas existentes, para «Romper barreras y unir a las personas», como se indica en una afirmación
Este proyecto, que se enfoca en promover la comunicación hablada en diferentes escenarios, tanto en el mundo real como en el metaverso, incluye soporte para todos los idiomas, independientemente de que sean escritas y habladas o exclusivamente hablada.
Meta comentó que, hasta ahora, la traducción de IA se ha «centrado principalmente en los idiomas escritos» y reconoció que hay más de 7.000 idiomas vivos en todo el mundo, de los cuales aproximadamente la mitad son «no tienen un sistema de escritura estándar o ampliamente utilizado.
Asimismo, reiteró que es consciente de este vacío que existe en este último debido a que los modelos de aprendizaje automático requieren más información para desarrollar la traducción simultánea. Por ejemplo, Gramática y ortografía.
Para afrontar este reto, creó su primer sistema de traducción para un lenguaje predominantemente oral, como es el el hokkien Esto, que se habla en algunas regiones chinas, carece de una forma escrita estándar, por lo que inicialmente no se pudo traducir. a través de sus estándares de IA.
Para trabajar en este proyecto, la empresa destaca que la recopilación de datos «fue un gran obstáculo»principalmente porque no tenía suficiente información para construir modelos de aprendizaje automático.
Para solucionar esta falta de información, Meta aprovechó el chino mandarín como lengua intermedia para construir traducciones relativamente fieles. Primero, tradujo el discurso de Hokkien al texto en mandarín. Como consecuencia de este paso intermedio, el resultado de la la traduccion ha mejorado tomando como referencia los datos de un lenguaje similar.
Luego, mediante un modelo de entrenamiento, se analizó la semántica y la oratoria de este idioma y se comparó con otros idiomas que tienen un formato escrito, como el inglés. Más tarde sintetizó el idioma inglés a partir de textos escritos y creó un idioma paralelo entre Hokkien e inglés.
UN SISTEMA DE VOZ A VOZ
La empresa recordó que la mayoría de los sistemas de traducción se basan en transcripciones de voz a texto y reformuló este concepto para analizar las transcripciones de voz a voz.
Para hacer esto, utilizó la traducción de voz a unidad (S2UT) para traducir el habla en una secuencia de unidades acústicas y generar diferentes formas de onda a partir de ellas. Más tarde, se adoptó Unity para un mecanismo de decodificación de dos fases.
Primero, el decodificador genera el texto traducido del idioma no escrito a texto sin formato. un idioma relacionado (en este caso mandarín) y luego crear unidades acústicas. En este sentido, el fabricante reconoció que ha desarrollado un sistema que transcribe el discurso de Hokkien a una notación fonética estandarizada lo llamó Tai.
Por otro lado, recordó que los sistemas de traducción de voz se suelen evaluar utilizando una métrica llamada ASR-BLEU. Este sistema consiste en transcribir primero el discurso traducido a texto mediante ‘aprendizaje automático’ y luego calcular la calidad de la transcripción de esta solución tecnológica, comparando el texto traducción automática versus traducción humana.
Como esto no es posible con Hokkien, al no tener una gramática escrita, Meta creó su primer conjunto de datos de referencia traducción bidireccional. Este es un sistema de código abierto en el que los investigadores pueden participar para avanzar en el propio sistema de traducción de Meta.
Finalmente, la empresa anunció que esta solución de traducción se encuentra actualmente en sus primeras etapas y espera pronto poder ofrecer traducción simultánea entre múltiples idiomas.
Asimismo, aseguró que este proyecto se puede extender a más idiomas además de Hokkien y por ello anunció que publicará un corpus de traducciones llamada de voz a voz matriz de voz, que extrajo de su Herramienta de representación de oraciones agnósticas del lenguaje (LASER).