Hola, soy Esther Checa y hoy me gustaría explicar cómo Microsoft, podrá clonar tu voz para poder tener reuniones por Teams en múltiples idiomas. Esta compañía ha anunciado una nueva herramienta para Teams llamada Interpreter, que permitirá a los usuarios clonar sus voces y utilizarlas en traducciones de voz en tiempo real durante reuniones, pudiendo facilitar la comunicación hasta en nueve idiomas diferentes.
¿Por qué es importante esto? Esta tecnología se espera que permita una comunicación multilingüe en tiempo real, facilitando una experiencia más fluida y personalizada en reuniones virtuales multiidioma. Sin embargo, también plantea desafíos importantes en materia de seguridad, como por ejemplo, el riesgo de suplantación de identidad mediante el uso indebido de la clonación de voces.
¿Conoces Interpreter?
Este año Microsoft ha presentado Interpreter para Teams, una función que permitirá la traducción de voz a en tiempo real en inglés, francés, alemán, italiano, y español, entre otros. En palabras del equipo directivo de Microsoft, esta funcionalidad pretende reducir las barreras lingüísticas al ofrecer traducciones más inmersivas. Además, la compañía asegura que la herramienta no almacena datos biométricos, no altera las emociones expresadas en la voz, y puede ser desactivada desde la configuración de Teams. Para habilitar esta característica, se requiere el consentimiento explícito del usuario.
Esta solución empezará a implementarse en 2025, y estará disponible para los suscriptores de Microsoft 365. A pesar de su potencial innovador, esta tecnología no está exenta de desafíos, algunos de estos pueden ser las limitaciones léxicas, ya que las traducciones automáticas generadas por inteligencia artificial suelen carecer de la riqueza léxica que tiene la lengua, y tienen dificultades para interpretar coloquialismos y matices culturales, lo que puede limitar su precisión en ciertos contextos. Aun así, la escalabilidad hace que estas soluciones resulten atractivas para las compañías.
¿Conoces Voice Engine?
Si bien la clonación de voz puede ofrecer una oportunidad para acercar a los usuarios, también tiene riesgos asociados con los deep fakes, suponiendo una amenaza real como la desinformación y los fraudes. OpenAI, por ejemplo, decidió no lanzar su solución de voz Voice Engine, debido a estos riesgos. Por ejemplo, esta tecnología, con solo escuchar una voz durante 15 segundos, era capaz de crear una copia sintética de dicha voz, e imitar su tono.
Entre las aplicaciones potenciales de Voice Engine se encontraba la asistencia en la lectura mediante voces naturales, la traducción de contenido, manteniendo el acento nativo del hablante, y el apoyo a pacientes en la recuperación de su voz. Sin embargo, OpenAI continúa evaluando su despliegue para mitigar posibles usos indebidos.
Sin embargo, la compañía deberá implementar medidas robustas de seguridad y garantizar la transparencia en el uso de esta herramienta para mitigar estos peligros. La adopción exitosa dependerá tanto de la tecnología, como de la confianza que los usuarios podamos depositar en esta.