La aparición de DALL-E y de sus grandes competidores, Midjourney o Stable Diffusion, ha disparado el interés por los modelos de IA generativa en el ámbito artístico. Son muchas las empresas que han creado productos fantásticos y llamativos —o los han integrado en los ya existentes, como la todopoderosa Adobe— pero sigue habiendo espacio para otras soluciones.

Lo demuestra Pikaso, la nueva herramienta de creación artística de Freepik. La empresa lleva tiempo trabajando en soluciones basadas en la IA generativa y ahora presenta su nueva e interesante opción. En Xataka hemos podido probarla y hablar con Omar Pera, uno de sus responsables.

En Pikaso la generación de imágenes es especialmente destacable porque se produce (casi) en tiempo real. Esa es la gran característica diferenciadora de una plataforma que nos permite generar imágenes que combinan un prompt de texto con un boceto que podremos crear fácilmente con la herramienta de dibujo que ofrece la interfaz.

La mezcla de ambas opciones hace que el sistema sea capaz de actuar de forma instantánea para crear lo que buscamos. La interfaz es sencilla y se centra en ofrecer a la izquierda un "lienzo" en el que dibujar nuestro boceto, una caja de resultados generados por IA en la parte derecha, y una tercera caja de texto debajo de estas dos en la que podremos introducir el prompt.

Es especialmente importante que seamos descriptivos con el prompt, ya que los detalles que demos en ese texto serán los que permitan al motor de IA "entender" qué queremos y aplicarlo sobre el esqueleto del boceto que hemos creado. Ambas entradas —estamos ante un sistema multi-modal— son las que definen el comportamiento y resultado final de Pikaso.

Dibujar por las buenas en la pantalla de un ordenador o en la de un móvil no es especialmente sencillo sobre todo si no tenemos experiencia, pero eso no importa demasiado: Pikaso no necesita gran cosa para trabajar: bastan unos garabatos (e incluso ni eso) y la citada descripción del prompt.

En el panel que nos permite dibujar hay de hecho acceso especial a una librería de formas geométricas e iconos. Las primeras hacen que sea fácil añadir ese tipo de elementos a nuestro boceto.

Los segundos permiten que nuestro lienzo tenga elementos que queremos incluir para que sean fácilmente reconocibles para la IA y no nos den excesivo trabajo si queremos bosquejarlos.

A partir de ahí, en la parte derecha aparecerá un primer diseño preliminar, normalmente en tonos tenues y que estará probablemente desdibujado. La gracia empieza ahí: encima de esa ventana derecha aparecen tres controles.

El primero, un control deslizante con la "Imaginación" que usa el modelo (cuanto más alto, más imaginativo y creativo), en segundo, un control para "reimaginar" el diseño y cambiar un poco el enfoque. Y en tercero, un botón "Enhance" ("Mejorar") que se encarga de crear una imagen final más detallada y de mejor calidad.

Lo realmente llamativo de la herramienta es que a medida que vamos realizando cambios, eso hace que en la parte derecha el resultado cambie en tiempo real, o casi. Podemos hacer un nuevo trazo en la parte izquierda, añadir más detalles en el prompt de texto, incluir alguna nueva forma geométrica o icono, mover las que ya tenemos.... todos esos cambios se irán reflejando inmediatamente en el resultado final, algo realmente llamativo y que demuestra la potencia del modelo.

En Xataka hemos podido hablar con Omar Pera (@ompemi), uno de los responsables de la creación de esta nueva función de Freepik. Como él nos contaba, Pikaso se basa en un estudio reciente que analiza los llamados Latent Consistency Models (LCM), unos modelos generativos capaces de generar imágenes de alta resolución a través de descripciones de texto.

A diferencia de otras técnicas, estos sistemas aprenden a predecir la representación "latente" de una imagen a partir del prompt de entrada, en lugar de generar la imagen píxel por píxel. Eso simplifica notablemente el proceso en comparación con los modelos de difusión, que requieren numerosos pasos adicionales para generar esas imágenes.

Es posible hacer mucho con muy, muy poco. Ni siquiera hay que garabatear si uno no quiere: basta con insertar iconos, recolocarlos y jugar con el prompt —cambiar el color o estilo de pelo o camiseta en tiempo real es sorprendente— para obtener esos resultados.

Como destacaba Pera, "han encontrado una forma una orden de magnitud más eficiente para generar imágenes por IA, y eso abre un nuevo mundo. Antes tardaba segundos, ahora milisegundos. Y venimos de fotos de stock hechas a mano en horas. Las IAs generativas en imagen y vídeo permiten multiplicar por diez el número de personas que pueden crear diseños y ser creativos, sin necesidad de otras apps complejas que puedan convertirse en una barrera de entrada para plasmar tus ideas".

Además hay otro apartado clave en Pikaso que nos destacaba este desarrollador. Hay varias plataformas que han aprovechado también rápidamente el avance planteado por los LCMs, pero Freepik incluso es capaz de evitar que necesites dibujar nada en el boceto: los iconos y elementos gráficos que hay disponibles en la bliblioteca del servicio se pueden añadir directamente y, a partir de ellos y del prompt, crear la imagen deseada.

