Black Forest Labs, una compañía formada por antiguos ingenieros de Stability AI, ha desarrollado Flux, una herramienta de generación de imágenes con inteligencia artificial (IA) a partir de textos, que está revolucionando el sector. Se trata de un potente modelo de IA de texto a imagen de código abierto que busca ampliar los límites de la creatividad, eficiencia y diversidad en la generación de imágenes.

El sistema capaz de generar imágenes fotorrealistas partiendo de descripciones en lenguaje natural está demostrando que saca el máximo rendimiento a los algoritmos y genera imágenes de alta resolución y definición de detalles de forma más precisa. Y destaca por una de sus características: su capacidad para escribir textos dentro de la propia ilustración generada, lo que implica un salto en la calidad de generación de imágenes.

El proyecto lo ha desarrollado el equipo de Black Forest Labs, al frente del cual están los ingenieros Robin Rombach, Andreas Blattmann y Dominik Lorenz, que provienen de Stabilty AI, y conocidos como desarrolladores de los modelos de Stable Diffusion, un motor de inteligencia artificial diseñado para crear imágenes a partir de texto (Stable Diffusion XL, Stable Video Diffusion, Rectified Flow Transformers). Al equipo se ha unido Patrick Esser. "Creemos que la IA generativa será un componente fundamental de todas las tecnologías futuras. Al poner nuestros modelos a disposición de una amplia audiencia, queremos llevar sus beneficios a todos, educar al público y mejorar la confianza en la seguridad de estos modelos. Estamos decididos a construir el estándar de la industria para los medios generativos", aseguran sus impulsores. 

También de texto a video

La herramienta Flux.1 ha irrumpido en un mercado altamente competitivo y está demostrando su profunda comprensión del lenguaje, con lo que puede entender e interpretar las descripciones más complejas y convertirlas en creaciones detalladas y coherentes. Muchos usuarios están comenzando a crear imágenes para luego usarlas como punto de partida en la generación de vídeos. De hecho, este será el próximo paso que dará el equipo de Black Forest Labs, que ya ha anunciado sus planes para desarrollar un conjunto de sistemas generativos de texto a vídeomediante un programa que, de momento, ha bautizado con el nombre Sota.

"Creemos firmemente que los modelos de acceso generalizado no solo fomentan la innovación y la colaboración en la comunidad de investigación y el mundo académico, sino que también aumentan la transparencia, que es esencial para la confianza y la adopción generalizada. Nuestro equipo se esfuerza por desarrollar tecnología de la más alta calidad y hacerla accesible a la mayor audiencia posible", determina la estrategia de Black Forest Labs.

31 millones de financiación

El desarrollo y distribución de Flux.1 ha sido posible gracias al cierre de una ronda financiación inicial por 31 millones de dólares (28,44 millones de euros) por parte de Andreessen Horowitz, principal inversor de Black Forest Labs, y varios business angels, como Brendan Iribe, Michael Ovitz, Garry Tan, Timo Aila y Vladlen Koltun. Asimismo, el equipo ha recibido inversiones de seguimiento de General Catalyst y MätchVC. 

Black Forest Labs tiene como objetivo desarrollar y promover modelos de aprendizaje profundo generativo de última generación para diversas formas de medios, como imágenes y vídeos, y ampliar los límites de la creatividad, la eficiencia y la diversidad.

Diversas versiones

La herramienta se ha presentado en tres versiones. Flux.1 PRO para profesionales y empresas, Flux.1 DEV para desarrolladores, y Flux.1 SCHNELL para usuarios particulares. La versión PRO proporciona un rendimiento de vanguardia con un seguimiento de prompts (instrucción, pregunta o un texto que se utiliza para interactuar con sistemas de inteligencia artificial) de primer nivel y calidad de imagen, disponible a través de su API y socios selectos. La versión DEV es un modelo de pesos abiertos y guiado para uso no comercial, ofreciendo capacidades similares a la versión PRO, pero de manera más eficiente. La versión SCHNELL es la más rápida, adaptada para desarrollo local y uso personal bajo una licencia Apache 2.0. Todas las variantes se pueden acceder a través de varias plataformas como Replicate y fal.ai, con código de código abierto disponible en GitHub para las versiones DEV y SCHNELL, según informa Computer Hoy.