OpenAI continúa revolucionando el campo de la inteligencia artificial con la última actualización de ChatGPT, que introduce mejoras sustanciales en su Modo de Voz Avanzado. Estas mejoras permiten una comunicación más fluida y natural entre el usuario y el modelo, consolidando a ChatGPT como una herramienta líder en asistentes virtuales conversacionales.
El año pasado, OpenAI revolucionó la interacción con la inteligencia artificial al lanzar el Modo de Voz Avanzado para ChatGPT. Esta es una función diseñada para hacer las conversaciones más naturales, con expresiones emocionales y señales no verbales que imitan la comunicación humana. En un principio, esta innovación estuvo disponible solo para usuarios de planes de pago, pero debido a su popularidad, la compañía decidió extenderla también a los usuarios gratuitos, aunque con ciertos límites de uso.
A pesar de que la recepción por parte de los usuarios ha sido positiva, un problema persistente ha sido las interrupciones innecesarias durante las conversaciones. OpenAI ya había sugerido una solución parcial para los usuarios de iPhone: activar el modo de Aislamiento de Voz para reducir estas interferencias. Sin embargo, la compañía no se detuvo ahí y hoy ha anunciado una nueva actualización que promete mejorar aún más la experiencia de voz.

Integración de GPT-4o: un salto cualitativo en la interacción por voz
La actualización incorpora el modelo GPT-4o, una versión optimizada que destaca por su capacidad para procesar y generar respuestas de voz de manera más eficiente. GPT-4o ha establecido nuevos estándares en reconocimiento y traducción de voz, logrando una puntuación de 88,7 en la prueba de comprensión lingüística multitarea masiva (MMLU), superando a su predecesor GPT-4, que obtuvo 86,5.
Una de las características más destacadas de GPT-4o es su capacidad nativa de procesamiento de voz a voz. A diferencia de versiones anteriores que requerían convertir la voz en texto y viceversa, GPT-4o permite interacciones casi instantáneas y fluidas, mejorando significativamente la experiencia del usuario.
Soporte multilingüe y accesibilidad mejorada
El Modo de Voz Avanzado actualizado también amplía su soporte a más de 50 idiomas, cubriendo aproximadamente el 97% de los hablantes a nivel mundial. Esta capacidad multilingüe facilita interacciones más inclusivas y accesibles para usuarios de diversas regiones y culturas.
Además, la nueva versión de ChatGPT optimiza el uso de tokens para idiomas que no se basan en el alfabeto latino, reduciendo costos y mejorando la eficiencia en la comunicación. Estas mejoras refuerzan el compromiso de OpenAI con la democratización de la inteligencia artificial y su accesibilidad global.
La actualización del Modo de Voz Avanzado en ChatGPT, impulsada por la integración de GPT-4o, representa un avance significativo en la interacción hombre-máquina. Con mejoras en la fluidez de las conversaciones, soporte multilingüe y procesamiento de voz más eficiente, OpenAI reafirma su liderazgo en el desarrollo de tecnologías de inteligencia artificial conversacional, ofreciendo herramientas más poderosas y accesibles para usuarios de todo el mundo.
