Google persigue 'a los tramposos': nuevo sistema para detectar textos con IA

SynthID, de Google, marca distancias e identifica el contenido generado por IA mediante la inserción de marcas de agua digitales directamente en las imágenes, audio, texto o vídeo generados por IA. Ser capaz de identificar el contenido generado por IA es fundamental para promover la confianza en la información. Aunque no es el único aspecto para abordar problemas como la desinformación o la atribución errónea, SynthID es un conjunto de soluciones técnicas prometedoras a este problema urgente de seguridad de la IA.

Este conjunto de herramientas se ha lanzado actualmente en versión beta y sigue evolucionando. Ahora se está integrando en una gama creciente de productos, ayudando a empoderar a las personas y las organizaciones a trabajar de manera responsable con contenido generado por IA. SynthID utiliza una variedad de modelos y algoritmos de aprendizaje profundo para marcar el agua e identificar contenido generado por IA.

¿Cómo funciona?

Un software genera texto al mismo tiempo. Estas fichas pueden representar un solo carácter, palabra o parte de una frase. Para crear una secuencia de texto coherente, el modelo predice al siguiente texto más probable que se genere. Estas predicciones se basan en las palabras anteriores y las puntuaciones de probabilidad asignadas a cada texto potencial. Por ejemplo, con la frase "Mis frutas tropicales preferidas son __". El LLM (software) puede empezar a completar la frase con las fichas "mango", "lichi", "papaya" y a cada ficha se le da una puntuación de probabilidad. Cuando hay una variedad de fichas diferentes para escoger, SynthID puede ajustar la puntuación de probabilidad de cada texto previsto, en los casos en que no comprometa la calidad, la precisión y la creatividad de la salida.

Este proceso se repite a lo largo del texto generado, de manera que una sola frase puede contener diez o más puntuaciones de probabilidad ajustadas y una página puede contener centenares. El patrón final de puntuaciones para las dos opciones de palabra del modelo combinado con las puntuaciones de probabilidad ajustadas se considera la marca de agua. Esta técnica se puede utilizar por solo tres frases. Y en medida que el texto aumenta, la robustez y la precisión de SynthID aumenta.

¿Y las imágenes?

SynthID añade una marca de agua digital que es imperceptible para el ojo humano directamente a los píxeles de una imagen generada por IA o a cada fotograma de un vídeo generado por IA. Esta tecnología está disponible para los clientes de Vertex AI mediante los modelos de texto en imagen, imagen 3 e imagen 2, que crean imágenes, de alta calidad en una gran variedad de estilos artísticos. La tecnología SynthID también marca las salidas de imagen a ImageFX. También hemos integrado SynthID en Veo, el modelo de generación de vídeo más capaz hasta ahora, que está disponible para creadores seleccionados en VideoFX. SynthID también puede escanear una sola imagen o los fotogramas individuales de un vídeo para detectar la marca de agua digital. Los usuarios pueden identificar si una imagen, o parte de una imagen, ha sido generada por las herramientas de IA de Google mediante la función En cuanto a esta imagen en Cerca o Chrome.

Google persigue 'a los tramposos': nuevo sistema para detectar textos con IA

Google presenta SynthID para detectar textos, pero también imágenes y audios creados con inteligencia artificial

¿Cómo funciona?

¿Y las imágenes?