Meta ha presentado un modelo de inteligencia artificial (IA) que es capaz de traducir voz y texto en 101 idiomas y hacer traducciones en tiempo real de voz a voz en 36 lenguas, entre ellas, el catalán. Esta inteligencia artificial, que pronto estará disponible para todo el público, imita la voz de los interlocutores, filtra más del 40% de los ruidos y, en contra de la estrategia en redes de Mark Zuckerberg, mitiga la "toxicidad", moderando los mensajes violentos. Este modelo, que recibe el nombre de SEAMLESSM4T y que no se podrá usar con finalidades comerciales, ha recibido muy buenas perspectivas de los expertos, que aseguran que supera a los existentes, y que podría allanar el camino hacia las traducciones universales rápidas.
La primera versión del modelo se anunció en agosto de 2023, y este miércoles un artículo publicado en la revista Nature, ha recibido varias innovaciones en la unificación del entorno de uso, los idiomas incluidos, los filtros de ruido y la diversidad de acentos. SEAMLESSM4T puede reconocer hasta 101 idiomas (escritos o hablados) y es capaz de traducir 36 en formato de voz y 96 en un archivo de texto. "Traduce entre un 8% y un 23% con más de precisión que los sistemas existentes, puede filtrar el ruido de fondo, entre un 42% y un 66% más, y se ajusta a la variación de voces", explica Marta Costa-Jussà, investigadora de la división de inteligencia artificial de Meta.
No sigue el mismo camino que con las redes
La compañía de Zuckerberg ha eliminado el sistema de verificación de datos y la moderación de contenidos en sus plataformas de comunicación, abriendo la puerta a bolas, sesgos y discursos de odio. En cambio, con el sistema de traducción simultánea, ha optado por la estrategia totalmente contraria, centrándose en la "mitigación de la toxicidad", porque esta puede inferir al sistema durante el aprendizaje automático o en la traducción. Meta considera toxicidad las blasfemias o respuestas que pueden incitar al odio, la violencia o el abuso contra una persona o un grupo (como una religión, raza o género). Para mitigarlo, ha desarrollado una herramienta denominada Etox, entrenada para detectar elementos tóxicos en el habla.
Otra de las limitaciones que intenta superar el nuevo sistema es la escasez de idiomas operativos. Aunque más de la mitad de la humanidad habla principalmente media docena de idiomas, la diversidad es tan amplia que quedan fuera del servicio más de 7.000 lenguas existentes en el mundo. El modelo de meta ha intentado paliar esta deficiencia incorporando hasta 101 lenguas, a pesar de la escasez de datos de audio y modelos para incorporarlos a la IA. Meta se encuentra ahora mismo en una misión para hacerse con el mercado de la inteligencia artificial, y ya anunciado que la compañía tendrá su propio buscador impulsado por IA y unas gafas inteligentes, en colaboración con Ray Ban, que funcionan con IA.