DALL-E: qué es, cómo funciona y cómo puedes utilizar esta inteligencia artificial para crear imágenes

Dall E
1 comentario Facebook Twitter Flipboard E-mail

Vamos a explicarte qué es DALL-E y cómo funciona esta inteligencia artificial capaz de generar imágenes a partir de texto. Se trata de una de las IA que comenzaron esta revolución de generar imágenes, junto a otras como Stable Diffusion y MidJourney.

Vamos a intentar que nuestra explicación sea simplificada, de forma que no necesites tener conocimientos técnicos ni entender tecnicismos para hacerte a la idea de cómo funciona. Y cuando terminemos, también te diremos cómo puedes probar DALL-E y usarla por tu cuenta para generar imágenes.

Qué es DALL-E

DALL-E es un sistema de inteligencia artificial creado por OpenAI, los mismos creadores de ChatGPT. En este caso, se trata de una IA que genera imágenes a partir de texto, de forma que solo le tienes que describir lo que quieres que dibuje, y generará la imagen de la nada.

Esta inteligencia artificial está basada en GPT-3, un modelo de lenguaje entrenado con millones de parámetros. Esto quiere decir que es capaz de entender lo que le estás pidiendo con lenguaje natural, ya que ha sido entrenada para distinguir las fórmulas que utilizamos al expresarnos y querer pedir o preguntar algo.

Además de esto, DALL-E ha sido entrenada también mediante una gigantesca biblioteca de obras de arte y fotografías. Gracias a esto, cuando le pides que dibuje a una celebridad, DALL-E sabrá a quién te refieres, y dibujará el aspecto que tiene esta persona realizando una acción que también sabrá interpretar y dibujar.

Además de esto, este sistema de inteligencia artificial es también capaz de combinar conceptos, estilos y atributos para una imagen. Vamos, que si te explayas explicándole que quieres ver determinada cosa, especificando detalles o incluso estilo artístico, la IA intentará combinarlo todo en la imagen.

DALL-E es un modelo que sigue en constante evolución. Su primera versión fue presentada en 2021, y en 2022 OpenAI presentó DALL-E 2, que es la versión actual. Y con el tiempo sacará un DALL-E 3, que será más capaz y generará mejores imágenes a través de nuestros textos.

Cómo funciona DALL-E

FALL-E utiliza lo que se llama un modelo de difusión, que son esos sistemas de inteligencia artificial capaces de crear imágenes de la nada. En este proceso de creación, aprende de las estructuras latentes de los datos para entrenarse para eliminar el ruido gaussiano de imágenes borrosas, que son esas pequeñas distorsiones que pueden generarse en este tipo de IAs.

Su proceso de creación es el mismo que otras IA similares, y se puede resumir en tres pasos. Primero, codifica y entiende el texto que le has escrito en el prompt o petición. De esta manera intenta saber a qué te refieres, e intenta distinguir los diferentes rasgos, características y estilos que has pedido que dibuje.

Luego, DALL-E crea información de imagen a partir de esta petición, y finalmente utiliza un decodificador que pinta la imagen partiendo de ese texto. En definitiva, primero entiende lo que le pides, luego piensa qué elementos va a tener dependiendo de tu petición, y finalmente realiza el dibujo.

Cada vez que le pides que dibuje algo el resultado cambia, ya que lo procesa de nuevo desde cero. Por lo tanto, puedes ir haciéndole una petición hasta que finalmente te dibuja lo que quieres ver.

Cómo usar DALL-E

Dalle Web

OpenAI, que es la empresa desarrolladora de esta IA, tiene disponible una página web oficial donde puedes usar DALL-E. Lo único que necesitas es haberte registrado en OpenAI, lo mismo que necesitas para usar ChatGPT. Por lo tanto, puedes usar ambas IA con una misma cuenta. La web de DALL-E es Openai.com/dall-e-2, donde tienes que identificarte o registrarte.

Escribe

Una vez te has identificado, entrarás en la página de DALL-E, donde tienes varios créditos gratuitos para poder probar esta IA. En ella, tienes una barra donde debes escribir lo que quieres que dibuje, algo que puedes hacer tanto en inglés como en español.

Resultado

Y ya está, cuando le escribas algo y pulses en el botón de Generate, la IA se tomará unos segundos y te presentará 4 imágenes que representan lo que le hayas pedido que dibuje. Luego, puedes pedirle más cosas diferentes o añadir más detalles a tu petición para afinar, aunque también puedes pedirle que vuelva a generar imágenes a partir del mismo promtp.

Inicio