Google sigue afinando sus herramientas creativas con inteligencia artificial, y esta vez le ha tocado el turno a Flow, la plataforma para creadores de video que ya ha dado mucho de qué hablar desde su lanzamiento. En julio de 2025, Google anunció una nueva función que promete abrir las puertas a una expresividad más rica: ahora es posible generar voz en videos creados a partir de imágenes usando Veo 3.

A continuación te contamos en detalle qué trae esta novedad, cómo puedes usarla y qué significaría para quienes están explorando la creación audiovisual con inteligencia artificial.

¿Qué es Flow y cómo funciona Veo 3?

Flow es una herramienta de Google Labs pensada para facilitar la producción de videos mediante inteligencia artificial. En lugar de tener que grabar, editar y montar un video desde cero, Flow permite generar clips simplemente a partir de texto o imágenes. Está dirigida tanto a creadores profesionales como a quienes están dando sus primeros pasos en la producción audiovisual.

El motor que potencia esta experiencia es Veo 3, una versión avanzada del generador de video por IA de Google. Entre sus características más destacadas está la capacidad de transformar fotogramas estáticos en clips animados (lo que Google llama «Frames to Video«) y de añadir efectos de sonido y ruido ambiental que refuercen la sensación de realismo.

Hasta ahora, esos efectos eran solo eso: sonidos, sin que los personajes pudieran hablar. Con esta nueva actualización, las cosas cambian.

Una nueva voz para tus videos: así funciona la generación de habla

La gran novedad anunciada por Google es que Flow ahora permite generar voz en los videos creados a partir de imágenes. Esto significa que, si subes una imagen y usas la función Frames to Video, podrás dotarla de movimiento y también de diálogo hablado.

Pongamos un ejemplo: imagina que tienes una ilustración de dos perros sentados en un parque. Antes, podías animarlos para que movieran la cabeza y el entorno cobrara vida. Ahora, además, podrás hacer que uno diga: “Hace un día precioso para pasear” y el otro responda: “Siempre y cuando no aparezca el gato del vecino”.

Este tipo de interacción hablada puede generar un nuevo nivel de empatía y narrativa, muy valioso tanto para creadores de contenido como para educadores, publicistas o artistas visuales.

Una función experimental que sigue evolucionando

Es importante tener en cuenta que la generación de voz aún está en fase experimental. Esto quiere decir que los resultados pueden ser variables, y en algunos casos, la sincronización entre la voz y el movimiento facial podría no ser perfecta. Sin embargo, es un paso firme hacia una experiencia audiovisual cada vez más fluida y automatizada.

La función ya está disponible tanto en Veo 3 como en su versión rápida, Veo 3 Fast, lo que permite a los usuarios aprovechar sus créditos de forma más eficiente.

Más países, más creadores

En paralelo al lanzamiento de esta nueva función, Google también anunció la expansión de Flow y del acceso a Google AI Ultra a 76 nuevos países. Esto eleva el total de territorios con disponibilidad a más de 140 países, siempre y cuando se cuente con un plan Google AI Pro o Ultra.

Este movimiento busca acercar las capacidades de generación de video con IA a una comunidad global de usuarios, promoviendo la inclusión y la diversidad de voces y estilos en el mundo del contenido digital.

Algunas consideraciones técnicas

Aunque la herramienta está ganando terreno rápidamente, hay algunos detalles a tener en cuenta:

  • La disponibilidad de funciones puede variar según el país, por lo que conviene revisar la información oficial de Google antes de planificar proyectos específicos.
  • No todos los tipos de imágenes son compatibles con la función Frames to Video, en especial aquellas con resoluciones atípicas o con estructuras poco definidas.
  • El uso de voces generadas implica una cierta latencia, ya que el sistema necesita procesar tanto la animación como el audio. Esto puede demorar algunos segundos adicionales, especialmente en dispositivos con menor capacidad de procesamiento.

Implicaciones para el futuro del contenido audiovisual

La posibilidad de generar voz desde imágenes marca un hito importante en el desarrollo de herramientas creativas con IA. No se trata solo de automatizar tareas, sino de permitir nuevas formas de narrar y de expresar ideas.

Si antes necesitabas una cámara, actores, micrófonos y horas de edición para hacer un sketch animado, ahora bastan una imagen y unas líneas de texto. Esto puede ser una ventaja enorme para pequeños estudios, docentes, creadores independientes o simplemente para quienes quieren experimentar sin grandes recursos.

Claro, también plantea nuevos desafíos en torno a la autenticidad del contenido y la verificación de lo que es real o generado por IA, pero eso es tema para otro artículo.

Por ahora, la llegada de esta nueva función abre la puerta a un sinfín de posibilidades creativas, accesibles desde cualquier lugar del mundo.

Granjas oceánicas verticales: una nueva forma de cultivar en el mar con impacto positivo

Las granjas oceánicas verticales, también conocidas como acuicultura vertical o 3D ocean farming, son sistemas de cultivo en el mar que aprovechan el espacio de forma tridimensional. Imagina un edificio submarino: en lugar de ocupar grandes extensiones horizontales, se utiliza todo el perfil del agua, desde la superficie hasta el fondo marino, para cultivar algas, mejillones, ostras, vieiras y otros mariscos. Cada especie ocupa un nivel distinto, formando una especie de «huerto colgante» en el mar.