La creatividad digital está recibiendo un nuevo impulso gracias a la herramienta photo-to-video de Gemini, el sistema de inteligencia artificial de Google. Esta función permite transformar una imagen estática o un simple texto en un clip de video de ocho segundos, completo con sonido, efectos especiales y ambientación auditiva. Diseñada para quienes crean contenido audiovisual, esta funcionalidad está disponible para suscriptores de Google AI Pro y AI Ultra, permitiendo hasta cinco videos diarios según el plan.
De ilustración a animación con un solo prompt
Una de las formas más inmediatas de usar esta herramienta es convertir ilustraciones en pequeñas animaciones. Por ejemplo, una bicicleta ilustrada con colores vivos puede cobrar vida en un desierto dibujado, avanzando entre cactus mientras se escucha el sonido de las ruedas girando y un perro jadeando en la cesta. Esto convierte presentaciones o boletines en piezas visuales mucho más atractivas, sin necesidad de conocimientos en animación tradicional.
Como punto técnico, Gemini genera los videos en formato horizontal 16:9. Si la imagen inicial tiene otro formato, se adapta con bordes negros, lo que es importante considerar al preparar el contenido visual. Aunque el resultado no siempre es perfecto en el primer intento, el sistema mejora con la práctica y los modelos de Veo 3 continúan aprendiendo.
Fotografía que cobra vida
Otra aplicación llamativa de Gemini photo-to-video es la posibilidad de transformar fotos reales en escenas animadas. Por ejemplo, una estatua de esqueleto de dinosaurio puede moverse, dar un paso, observar a su alrededor y rugir, todo a partir de una simple imagen.
Aquí entra en juego la creatividad en los prompts. Si el usuario desea una narrativa más compleja, puede añadir instrucciones paso a paso. En un ejemplo elaborado por el equipo de Google, una estatua del sistema operativo Android sostiene un helado. El prompt indica que el personaje debe saludar a la cámara mientras un perro entra en escena y le roba el helado. El resultado: una mini historia que mezcla sorpresa, ternura y humor, ideal para redes sociales o piezas promocionales.
En estos casos, la claridad del sujeto en la imagen es esencial para lograr una buena animación. Si está borroso o muy alejado, la IA puede tener dificultades para interpretar la escena. Como medida de transparencia, todos los videos llevan una marca de agua visible y otra digital (SynthID), que certifica su origen generado por inteligencia artificial.
Expresar ideas creativas con más precisión
Una de las ventajas más potentes de esta tecnología está en la previsualización de conceptos. Cuando un productor creativo necesita presentar una idea, hacerlo con un video generado por IA permite transmitir la visión de forma clara y rápida.
Imaginemos una sala de grabación con dos sillones y una pared iluminada. El prompt puede indicar que primero aparezca una mesa con micrófonos de pódcast, luego se transformen en platos de alitas con salsas picantes, y finalmente se convierta en una escena de cumpleaños con pastel y globos flotando. Todo esto sucede en segundos, con transiciones suaves y una música instrumental alegre de fondo.
Este nivel de detalle requiere prompts complejos, pero los resultados suelen ser más precisos que los generados a partir de texto puro o bancos de imagen. Para mejorar los resultados, Gemini puede incluso ayudar a refinar los prompts, añadiendo instrucciones sobre movimientos de cámara o efectos visuales.
Creatividad aumentada, no sustituida
La autora del artículo original en The Keyword, Tatiana Gonzalez, reflexiona sobre su experiencia como productora de contenido en Google. Reconoce que la herramienta despierta sentimientos encontrados: entusiasmo por las nuevas posibilidades y cierta inquietud por el papel de la IA en procesos creativos. Sin embargo, destaca que estos videos muchas veces nacen de ideas que no podrían haberse realizado por falta de recursos, tiempo o habilidades técnicas. En ese sentido, Gemini actúa como un amplificador creativo, no como un reemplazo.
La posibilidad de generar clips cortos con sonido y narrativa permite a muchos creadores llevar sus proyectos más allá, sin necesidad de equipos de filmación, software de edición o actores. Es una herramienta que democratiza la producción audiovisual, siempre que se use con criterio y honestidad sobre su origen.