Google ha dado un paso firme en el mundo de la inteligencia artificial generativa con el lanzamiento generalizado de Veo 3 y Veo 3 Fast en Vertex AI, su plataforma de servicios en la nube. Aunque estas herramientas ya habían sido mostradas durante el evento Google I/O 2025, ahora están oficialmente disponibles para todos los usuarios con una cuenta en Google Cloud.

Esto significa que cualquier persona interesada en la creación de contenido audiovisual, desde profesionales del marketing hasta creadores independientes, puede acceder a estas herramientas para generar vídeos realistas a partir de texto, con una calidad sorprendente.


¿Qué es Veo 3 y cuál es su gran novedad?

Veo 3 es un modelo de inteligencia artificial que permite generar vídeos de forma automática a partir de indicaciones por texto, conocidas como «prompts». Imagina poder escribir algo como «una mujer pidiendo un café en una cafetería» y recibir un vídeo que representa esa escena, con personajes, movimiento, diálogos y sonidos ambientales.

La gran diferencia respecto a versiones anteriores o a otras herramientas similares es que Veo 3 no sólo genera la imagen en movimiento: tambien crea el audio, incluyendo diálogos realistas y sonidos de fondo que enriquecen la escena. Los personajes generados por IA tienen una apariencia tan detallada que pueden confundirse con personas reales.


Veo 3 Fast: velocidad para iterar sin sacrificar calidad

Junto a Veo 3, Google ha presentado Veo 3 Fast, un modelo optimizado para acelerar la generación de vídeos sin comprometer demasiado la calidad visual. Esta versión está pensada para quienes necesitan probar muchas ideas rápidamente, como por ejemplo:

  • Variantes de anuncios publicitarios
  • Demos de productos
  • Contenido para redes sociales

Es como un borrador rápido que permite ver cómo quedaría un concepto antes de pasar a una versión más refinada con el modelo completo de Veo 3.


Cómo acceder a estas herramientas desde Vertex AI

Google ha integrado ambas herramientas dentro de Vertex AI, su entorno para desarrolladores y empresas que trabajan con modelos de inteligencia artificial. Solo es necesario tener una cuenta de Google Cloud para empezar a experimentar con la creación de vídeos.

Además, está previsto que en agosto se habilite una funcionalidad que permitirá transformar imágenes en vídeos, una opción que ya había sido probada en Gemini, otra herramienta de la suite de Google.


Ejemplos reales de lo que puede hacer Veo 3

Para ilustrar el potencial de estas herramientas, Google ha compartido algunos ejemplos que fueron generados con simples frases:

  • «Una mujer en un puente de piedra con la Torre Eiffel de fondo»: el resultado es un vídeo que parece grabado en París, con movimiento natural del cabello, cambios de luz y sonidos urbanos.
  • «Cliente haciendo un pedido en una cafetería»: la escena muestra la interacción con el barista, incluyendo gestos, respuesta verbal y el ruido característico de la máquina de café.

Este nivel de detalle muestra que Veo 3 no sólo interpreta las palabras, sino que entiende el contexto visual y sonoro que rodea la acción descrita.


Aplicaciones reales en empresas y agencias creativas

Google ha mostrado cómo varias empresas están aprovechando ya esta tecnología. Un caso destacado es el de la agencia BarkleyOKRP, que utilizó herramientas de IA como Gemini, Imagen, Lyria y Veo 3 para crear una campaña ficticia alrededor de una emisora de radio llamada «Slice».

Esta emisora incluía:

  • Avatares generados por IA actuando como locutores
  • Canciones originales creadas con IA en estilo de los años 90
  • Videos musicales y contenido promocional desarrollados con Veo 3

Todo el ecosistema fue generado por IA, desde el diseño de los artistas ficticios hasta las carátulas de los álbumes, demostrando cómo la tecnología permite llevar a cabo proyectos complejos de manera más eficiente.


Una nueva etapa para la creación de contenido audiovisual

La apertura de estas herramientas al público marca un cambio importante en la manera de crear vídeos. Lo que antes requería equipos de rodaje, actores y edición, ahora puede desarrollarse en minutos mediante un prompt bien escrito.

Esto no significa que las producciones tradicionales desaparezcan, pero sí que se abre la puerta a nuevos formatos, creadores emergentes y propuestas visuales que antes no eran viables por coste o tiempo.

LangExtract: la nueva biblioteca de Google para extraer información con IA de forma estructurada y confiable

Con el anuncio de LangExtract, Google presenta una herramienta que podría cambiar la forma en que procesamos grandes volúmenes de texto sin estructurar. Esta biblioteca de código abierto, basada en modelos de lenguaje como Gemini, está diseñada para ayudar a desarrolladores a extraer información de manera precisa, organizada y trazable, sin necesidad de entrenar modelos desde cero.