Midjourney, conocida por su plataforma de generación de imágenes mediante inteligencia artificial, ha dado un paso más en su evolución al introducir su primer generador de video con IA. Esta nueva herramienta, aunque aún en una versión inicial, ya permite transformar imágenes en animaciones breves, abriendo un nuevo abanico de posibilidades para creadores y entusiastas del contenido visual.
Se trata de una función integrada en la plataforma de Midjourney que permite crear videos de hasta 21 segundos a partir de imágenes generadas o subidas por los usuarios. Al igual que en la generación de imágenes, el proceso se basa en prompts de texto, pero con la particularidad de que ahora también se puede indicar cómo debe ser el movimiento dentro del clip.
Una vez que el usuario ha creado o subido una imagen, aparece un nuevo botón etiquetado como «animate«. Al hacer clic, el sistema genera un clip de 5 segundos usando un prompt genérico que simplemente le da movimiento a la escena. Pero si el usuario desea personalizar la animación, puede optar por el modo manual, donde especifica el tipo de movimiento deseado.
El sistema permite extender el video hasta en cuatro ocasiones, con bloques de 4 segundos cada uno, alcanzando un máximo de 21 segundos. Además, se pueden seleccionar distintos niveles de movimiento:
Esta función ofrece una flexibilidad interesante para quienes quieren experimentar con narrativas visuales en pequeño formato.
El generador de video de Midjourney está disponible en su plataforma web y también a través de su servidor de Discord. Para acceder a la herramienta, es necesario contar con una suscripción de pago, que parte desde los 10 dólares al mes, lo que da derecho a unas 3,3 horas de tiempo de GPU rápido (alrededor de 200 generaciones de imágenes).
Generar un video consume considerablemente más recursos: la empresa estima que cuesta unas ocho veces más que una imagen estática, lo que equivale a un segundo de video por el precio de una imagen.
El lanzamiento de esta herramienta no ha pasado desapercibido para la industria del entretenimiento. Midjourney está actualmente siendo demandada por Disney y Universal, quienes ven el generador de video como un riesgo para la propiedad intelectual. Alegan que el sistema actúa como una especie de «máquina expendedora» de copias no autorizadas de obras protegidas por derechos de autor.
Estas compañías argumentan que el modelo de entrenamiento ya está infringiendo sus derechos, al haber usado obras sin licencia como parte de su base de datos de aprendizaje. La demanda subraya que el video generativo, al ser más narrativo y visualmente complejo que una imagen, puede representar una amenaza mayor para los creadores tradicionales.
El anuncio de Midjourney se suma a un escenario cada vez más activo en el mundo de los videos generados por IA. Empresas como Google, OpenAI y Meta ya han presentado sus propios modelos, todos con la capacidad de crear clips a partir de simples descripciones escritas.
A diferencia de estas alternativas, Midjourney ha optado por centrarse inicialmente en la animación de imágenes, lo que podría verse como una estrategia gradual para integrar video sin sacrificar la calidad visual por la que la plataforma es conocida. David Holz, fundador de la empresa, lo describió como un «paso intermedio» hacia modelos futuros capaces de simulaciones en tiempo real de mundos abiertos.
Aunque sus aplicaciones todavía son limitadas, el generador de video de Midjourney puede ser útil para:
Como sucede con muchas herramientas emergentes, gran parte de su valor radica en la experimentación y en la creatividad de los usuarios que la adopten temprano.
Aunque la versión actual está limitada en duración y control, es razonable anticipar mejoras progresivas. A medida que se refinen los modelos, podríamos ver funciones como:
Como si de una caja de herramientas digitales se tratara, cada actualización podría sumar nuevas «llaves» para que los creadores den forma a mundos animados con unos pocos clics.