Gemini 2.5 Pro da un salto en IA: ya analiza videos y compite directamente con ChatGPT

Google sigue afinando su estrategia en el mundo de la inteligencia artificial con el lanzamiento de Gemini 2.5 Pro, una versión que no solo mejora su rendimiento técnico, sino que también introduce funciones que podrían marcar una diferencia clara frente a sus competidores. Esta nueva iteración del modelo se presenta como una de las más completas hasta la fecha, y llega con la intención de disputar directamente el liderazgo que hoy ostenta ChatGPT de OpenAI.

Uno de los primeros anuncios ha sido Gemini 2.5 Flash-Lite, una versión más ligera y eficiente, pensada para tareas que no requieren una gran carga computacional. Este modelo está orientado a entornos con recursos limitados o flujos de trabajo que demandan costes operativos bajos, sin sacrificar la calidad en las respuestas. Su corte de conocimiento se encuentra actualizado hasta junio de 2024, lo que lo mantiene vigente para un gran número de consultas cotidianas.

Este enfoque recuerda a los vehículos híbridos pequeños que, aunque no tienen la potencia de un coche deportivo, son ideales para moverse en ciudad con eficiencia y bajo consumo. Google aplica esa misma filosofía al diseño de sus modelos de IA: ofrecer herramientas adecuadas para cada contexto, sin derrochar recursos.

Google no se ha limitado a lanzar su nuevo modelo, sino que ha publicado tablas comparativas con los resultados de pruebas entre Gemini 2.5 Pro y GPT-4.1 de OpenAI. En dichas tablas, elaboradas por la propia Google, su modelo supera al de OpenAI en varios indicadores clave de rendimiento.

Sin embargo, es importante matizar estos datos: al ser una comparativa interna, debería contrastarse con evaluaciones independientes para garantizar la objetividad. Lo que sí es claro es que Google está apostando fuerte por mostrar que su tecnología puede estar, como mínimo, al mismo nivel que la de OpenAI.

La característica que ha despertado mayor atención es la capacidad de Gemini 2.5 Pro para analizar videos directamente. Esto significa que los usuarios pueden subir un archivo de video y preguntarle a la IA sobre lo que aparece en pantalla o lo que se escucha en el audio. Hasta ahora, la mayoría de modelos solo podían procesar texto e imágenes; la entrada de video representa una nueva dimensión.

Por ejemplo, un estudiante podría subir una clase grabada y pedir un resumen de los conceptos explicados, o un periodista podría analizar el contenido de una rueda de prensa sin tener que verla completa. Esto abre posibilidades muy valiosas tanto para profesionales como para usuarios particulares.

Este tipo de análisis combina procesamiento de imagen y audio, y se está desplegando progresivamente. Se espera que esté disponible en ambas versiones de Gemini: gratuita y de pago en dispositivos móviles.

Mientras tanto, OpenAI ha apostado por Sora, su generador de video, pero todavía no ha integrado completamente esta tecnología dentro de ChatGPT. Esto deja un espacio que Google ha sabido aprovechar con Gemini 2.5 Pro, al ofrecer desde ya la posibilidad de interactuar con contenido audiovisual.

La estrategia de Google parece clara: adelantarse en funciones prácticas que mejoren la experiencia del usuario, en lugar de centrarse exclusivamente en demostraciones técnicas. ChatGPT sigue contando con una gran base de usuarios y reconocimiento de marca, pero Google está pisando el acelerador con funciones innovadoras.

Este lanzamiento deja un mensaje contundente: la carrera por la IA generativa está más activa que nunca. Las compañías no solo compiten por desarrollar modelos potentes, sino por hacerlos más accesibles, versátiles y eficientes. La posibilidad de interactuar con videos puede cambiar la forma en que aprendemos, trabajamos y consumimos información.

En este nuevo panorama, es muy probable que OpenAI responda pronto con nuevas funcionalidades para ChatGPT, tal como ha ocurrido en ocasiones anteriores. Por ahora, quienes ya han probado Gemini 2.5 Pro afirman que la experiencia es fluida, precisa y sorprendente, especialmente al manejar formatos que hasta hace poco eran terreno exclusivo de los humanos.

Gemini 2.5 Pro da un salto en IA: ya analiza videos y compite directamente con ChatGPT

Leave a Reply Cancel reply

Suscríbete a mi newsletter

Sobre mi

Servicios

Enlace rápido

Contacto