Generación de imágenes con IA a partir de textos

Generación de imágenes con IA a partir de textos

Comparte esta entrada en tus redes sociales
Share on buffer
Buffer
Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
Linkedin

𝗛𝗼𝘆 𝗾𝘂𝗶𝗲𝗿𝗼 𝗵𝗮𝗯𝗹𝗮𝗿𝗼𝘀 𝗱𝗲 𝘂𝗻 𝘁𝗲𝗺𝗮 𝗾𝘂𝗲 𝗺𝗲 𝗮𝘀𝗼𝗺𝗯𝗿𝗮: 𝗹𝗮 𝗴𝗲𝗻𝗲𝗿𝗮𝗰𝗶ó𝗻 𝗱𝗲 𝗶𝗺á𝗴𝗲𝗻𝗲𝘀 𝗰𝗼𝗻 𝗜𝗔 𝗮 𝗽𝗮𝗿𝘁𝗶𝗿 𝗱𝗲 𝘁𝗲𝘅𝘁𝗼𝘀 🤖⌨️➡️🖼️

Cada vez hay más opciones para crear imágenes con IA, usando modelos de lenguaje natural que transforman las palabras en imágenes. Ayer se anunció la llegada de Imagen 2 para Google DeepMind, una app que promete ser muy potente y versátil para generar imágenes de alta calidad y realismo. También estamos a la espera de que Meta ponga Meta Imagine AI disponible en España.

Mientras tanto, he decidido hacer una prueba simple comparando las imágenes creadas por cuatro apps que ya están disponibles: Microsoft Copilot, ChatGPT Plus, Stabble Difusion y Adobe Firefly. Estas cuatro apps también usan modelos de lenguaje natural para crear imágenes a partir de textos, pero cada una tiene sus características y diferencias. La única de pago es ChatGPT Plus y aclaro que no he utilizado Midjourney, porque también es de pago y no tengo suscripción.

Para hacer la prueba, he usado el siguiente texto como prompt:

«𝗨𝗻 𝗴𝗮𝘁𝗼 𝗰𝗼𝗻 𝗮𝗹𝗮𝘀 𝗱𝗲 𝗺𝗮𝗿𝗶𝗽𝗼𝘀𝗮 𝘆 𝗰𝘂𝗲𝗿𝗻𝗼𝘀 𝗱𝗲 𝘂𝗻𝗶𝗰𝗼𝗿𝗻𝗶𝗼»

𝑫𝒊𝒔𝒄𝒍𝒂𝒊𝒎𝒆𝒓: Se trata de una simple prueba de ir por casa, no comparar con las imágenes de los retos del gran Jesus Serrano 😏

Adjunto las imágenes que he obtenido con cada app y mi breve valoración:

🔹Stabble Diffusion (Imagen 4): Creo que ha obtenido el resultado menos acertado, lo cual podría atribuirse a la gran cantidad de opciones disponibles al introducir el prompt. Esta variedad puede complicar la elección de los parámetros adecuados para obtener el resultado deseado.

🔹Adobe Firefly (Imagen 3): Aunque prefiero el resultado generado por DALL-E 3, debo destacar que Adobe Firefly ofrece una funcionalidad interesante: una vez creada la imagen, puedes manipularla, ajustando la relación de aspecto, modificando la intensidad visual o incluso regenerándola, eligiendo entre un estilo fotográfico o de ilustración.

🔹ChatGPT Plus (Imagen 1) y Bing Copilot (Imagen 2) – ambas integrando DALL·E 3: En mi opinión, han producido los mejores resultados a partir de un simple prompt. Probablemente esto se deba a que DALL-E 3 actúa como un ingeniero de prompts en sí mismo, perfeccionando tu solicitud inicial. Las imágenes resultantes son considerablemente más atractivas y, además, incluyen un fondo adecuadamente tematizado para complementar el prompt.

¿Cuál ha sido tu experiencia al trabajar con herramientas de generación de imágenes basadas en IA? ¿Utilizas menos los bancos de imágenes desde que puedes generar tus propias ilustraciones con IA?

Comparte esta entrada en tus redes sociales
Share on buffer
Buffer
Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
Linkedin
vicentgadea

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.