La actriz Scarlett Johansson ha cargado contra la empresa OpenAI después de que la compañía presentara la nueva generación de ChatGPT, la cual incluye una asistente virtual que tiene una voz muy similar a la de la actriz. En un comunicado, Johansson expone como hace meses la compañía la a contactar para ser la voz de ChatGPT, pero ella rechazó por “motivos personales”. Ahora, la actriz ha quedado “sorprendida” y “enfadada” al escuchar la voz que ha acabado teniendo el nuevo ChatGPT. “Sonaba tan extrañamente parecida a la mía que mis amigos más próximos y los medios de comunicación no podían notar la diferencia”, ha afirmado Johansson. Por su lado, OpenAI ha negado que la voz de su asistente virtual sea una imitación, pero lo ha retirado.
“La voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que utiliza su propia voz natural”, asegura la empresa en un comunicado. Y añade: “Creemos que las voces de la IA no tienen que imitar deliberadamente la voz distintiva de uno famoso”. Sin embargo, poco antes de la presencia del nuevo producto de la compañía, Salt Altman, máximo ejecutivo de OpenAI, afirmó: “El nuevo modo de voz (y vídeo) es la mejor interfaz de ordenador que he utilizado nunca. Parece la IA de las películas; y todavía me sorprende un poco que sea real”. Anteriormente, Altman también se ha declarado fan de la película Her (2013), en la que Johansson ponía voz a una asistente virtual de la cual el protagonismo se enamora.
Según la empresa, la voz es fruto de una asociación con directores de casting y productores independientes para encontrar “la personalidad única de cada voz y el suyo atractivo para las audiencias globales”. En este sentido, OpenAI buscaba una voz “atemporal”, “próxima”, “cálida” y “atractiva”, entre otras cualidades.
El nuevo ChatGPT
La semana pasada, la empresa presentó su asistente de IA, GPT-4o, la nueva versión gratuita, más rápida y con capacidades mejoradas de su popular chatbot. Por ejemplo, puede hacer una traducción simultánea de una conversación con otra persona en 50 idiomas, puede participar en una videoconferencia o describir lo que capta a través de la cámara de un teléfono. Además, reconoce emociones e imita las cadencias de las personas a la hora de hablar, para parecer cuanto más realista mejor.
El anuncio tuvo lugar al mismo tiempo que Google —uno de sus mayores rivales— celebraba su conferencia anual de desarrolladores, en la que enseñó un producto similar. Los asistentes de las dos empresas tienen cualidades humanas que les permiten ver, oír, razonar y ayudar al usuario.