Archivo mensual agosto 2024

Cómo creé un cuento animado para mi hija en solo dos días usando IA (y cómo tú también puedes hacerlo)

En la era digital, la tecnología no solo nos conecta y facilita el trabajo, sino que también nos permite crear experiencias únicas para nuestros seres queridos. Hoy quiero compartir una de esas experiencias: la creación de un cuento animado para mi hija, titulado «Martina y Dino en la Isla de los Dinosaurios».

El Origen de la Idea

Todo comenzó con la idea de crear algo especial para mi hija, Martina. En ese momento, estaba visualizando el Máster de Innovación e IA de Founderz, y fue viendo las lecciones de Jesús Serrano cuando me entró el gusanillo de trastear con herramientas como Runway. Lo que inicialmente iba a ser un sencillo cuento para Martina, rápidamente evolucionó en una ambición mayor: quería hacer algo más parecido a una «película». Así nació «Martina y Dino en la Isla de los Dinosaurios», un proyecto que, aunque no es perfecto, ha logrado emocionarnos profundamente.

Martina y Dino en la Isla de los Dinosaurios 🌴🦕

Cuento animado «Martina y Dino en la Isla de los Dinosaurios».

Las herramientas detrás del cuento animado

Lo más emocionante de este proyecto ha sido descubrir cómo la tecnología puede hacer realidad ideas que antes parecían inalcanzables. Durante el proceso, utilicé una combinación de herramientas basadas en inteligencia artificial, cada una aportando algo único al resultado final.

  • Microsoft Copilot y ChatGPT: Estas herramientas fueron fundamentales en varias etapas del proyecto: desde la generación de la historia hasta la creación de las imágenes. Lo primero que hice fue generar la narrativa completa de la historia. Una vez que tuve la historia bien definida, procedí a dividirla en escenas clave. A partir de estas escenas, empecé a crear los prompts específicos para cada imagen. Primero, definí un prompt muy detallado para describir cada aspecto del personaje y su entorno, usándolo como plantilla base para mantener los elementos clave constantes en todas las imágenes. Luego, le pedí a Copilot y ChatGPT que mejoraran esos prompts para obtener resultados más precisos. Generé cada imagen iterando varias veces hasta lograr la mayor consistencia visual posible. Aunque no es posible lograr una consistencia perfecta con estas herramientas, al repetir el proceso varias veces y hacer ajustes finos, conseguí una similitud razonable entre las imágenes.
  • Adobe Firefly: Dado que ChatGPT y Copilot generan las imágenes en formato cuadrado, utilicé Adobe Firefly para expandirlas y convertirlas en panorámicas (te lo explico aquí), lo que me permitió enriquecer el entorno visual de cada escena. Además, cuando me encontraba con resultados que me gustaban pero que tenían pequeños errores o elementos que sobraban, Adobe Firefly fue la herramienta ideal para hacer esos ajustes manuales, eliminando elementos innecesarios y retocando detalles para mejorar la coherencia visual y perfeccionar el resultado final. También tuve que utilizar Convertio para pasar las imágenes generadas por ChatGPT a formato PNG.
  • Runway: Para convertir las imágenes en fragmentos de vídeo, utilicé Runway, una herramienta que me permitió transformar las imágenes en clips animados. Sin embargo, como estaba usando la versión gratuita de Runway, tuve que recurrir a varias cuentas para obtener suficientes créditos y así completar el proyecto. Una de las grandes sorpresas fue descubrir el modelo Gen-3 Alpha, que es una auténtica pasada. Al comparar los resultados con el modelo anterior, Gen-2, me di cuenta de que con la versión antigua hubiera sido imposible lograr la calidad necesaria para este proyecto. Runway te permite elegir si la imagen que proporcionas es el inicio o el final del vídeo generado. Después de varias pruebas, descubrí que los vídeos salían mejor cuando elegía la opción «last» en lugar de «first». Esto hizo que la animación final tuviera un aspecto más profesional.
  • ElevenLabs: Para dar vida a cada escena, utilicé ElevenLabs para generar los audios, y debo decir que la experiencia fue excelente. Pude generar todos los audios que necesitaba usando únicamente mi cuenta gratuita, lo que fue una gran ventaja. La clave para que el proyecto funcione bien está en elegir una voz que se ajuste perfectamente al tono de la historia. En mi caso, seleccionar una voz que transmitiera calidez y emoción fue fundamental para que la narrativa cobrara vida de la manera que imaginaba. Otro aspecto importante fue ir modificando los textos de los audios para que la duración se adaptara a mis necesidades en cada escena.
  • Adobe Express: Finalmente, con Adobe Express, edité todo el material generado. Pude añadir títulos, efectos y transiciones, logrando un montaje final que, aunque tiene sus imperfecciones, refleja todo el cariño y la dedicación puestos en este proyecto. Si quieres aprender a utilizar esta herramienta para editar vídeos, te lo explico aquí.

Desafíos y aprendizajes

Uno de los mayores retos fue mantener la coherencia en los personajes a lo largo de las distintas escenas. Aunque la consistencia perfecta no es alcanzable con las herramientas utilizadas, refinar los prompts, iterar varias veces y ajustar manualmente las imágenes permitió obtener un resultado satisfactorio.

Una estrategia que me ha funcionado bastante bien es pedirle a ChatGPT-4o que elabore todas las imágenes a la vez, dándole todos los prompts de antemano. Al generar las imágenes una tras otra, el modelo tiende a mantener una similitud razonable entre ellas, lo que ayuda a que los personajes y los elementos visuales se vean coherentes a lo largo de la historia.

Aplicación educativa: Más allá del entretenimiento

Este proyecto no solo ha sido una experiencia personal enriquecedora, sino que también me ha abierto los ojos a las posibilidades educativas de estas herramientas. La integración de IA en el aula puede potenciar la manera en que enseñamos, permitiendo a los estudiantes no solo consumir contenido, sino también crearlo.

Imagina un proyecto de curso en el que los alumnos desarrollan sus propias historias animadas, integrando narrativa, arte, tecnología y habilidades de presentación. Este enfoque interdisciplinar no solo fomenta la creatividad, sino que también ofrece una experiencia de aprendizaje inmersiva y práctica.

Conclusión

Hace solo unos meses, realizar un proyecto como este hubiera sido imposible para mí. Pero hoy, con las herramientas disponibles, he podido crear algo increíble para mi hija. Y lo más emocionante es pensar en lo que vendrá en unos meses más. Las posibilidades que nos ofrecerá la tecnología seguirán aumentando, permitiéndonos crear experiencias aún más sorprendentes. ¡El futuro está lleno de oportunidades increíbles!


Herramientas utilizadas: