Desde septiembre de 2024, cuando OpenAI introdujo el primer modelo con capacidades de razonamiento profundo, otras compañías como Anthropic, DeepSeek, xAI y ahora Google han acelerado sus esfuerzos para no quedarse atrás. En la carrera vertiginosa por liderar la IA, Google ha dado un paso de gigante con el lanzamiento de Gemini 2.5, una nueva generación de modelos de IA diseñados específicamente para ‘razonar’ antes de generar una respuesta.
Esta característica marca una diferencia clave con modelos anteriores basados únicamente en predicciones estadísticas. Y es que el razonamiento en IA no se limita a clasificar o predecir: implica analizar información, considerar contexto, establecer conexiones lógicas y tomar decisiones fundamentadas.
Gemini 2.5 logra esto combinando avances en aprendizaje por refuerzo, técnicas de ‘cadena de pensamiento’ y una notable mejora en la arquitectura del modelo base.
Poder multimodal y contexto masivo
Uno de los aspectos más destacables de esta IA es su capacidad para procesar 1 millón de tokens, equivalente a unas 750.000 palabras, en una sola entrada. Pronto, se ampliará a 2 millones de tokens, lo que permitirá a la IA analizar libros enteros, bases de datos extensas o incluso repositorios de código completo de una sola vez.
Su naturaleza multimodal le permite interpretar y generar texto, audio, imágenes, video y código, convirtiéndolo en la opción ideal para tareas complejas como la creación de videojuegos desde un simple prompt o el diseño de aplicaciones web visualmente atractivas.
Logros técnicos impresionantes
Según LMArena, estamos ante el mayor salto entre dos generaciones de un mismo LLM
En pruebas clave, su rendimiento ha sido notable:
- Liderazgo en LMArena, una plataforma de evaluación basada en preferencias humanas.
- 68,6% en Aider Polyglot, una métrica para edición de código, superando modelos de OpenAI, Anthropic y DeepSeek.
- 63,8% en SWE-Bench Verified, que mide capacidades en desarrollo de software, superando a OpenAI y DeepSeek, aunque todavía por detrás del modelo Claude 3.7 de Anthropic (70.3%).
Además, en Humanity’s Last Exam, una prueba multimodal extremadamente compleja que abarca matemáticas, ciencias y humanidades, Gemini 2.5 obtuvo un 18,8%, estableciendo una nueva marca de referencia entre aquellos modelos que no utilizan herramientas externas.
Gemini 2.5, ya en acción
Google ha puesto este modelo en manos de desarrolladores y empresas a través de plataformas como AI Studio y Vertex AI, para que puedan experimentar y desarrollar soluciones escalables. El objetivo no es solo crear un asistente más inteligente, sino formar la base de agentes autónomos, sistemas capaces de ejecutar tareas sin intervención humana directa.
El primer modelo de esta serie, Gemini 2.5 Pro Experimental, es actualmente el más avanzado de Google y ya está disponible para desarrolladores en Google AI Studio, así como para suscriptores de Gemini Advanced, el plan premium de la compañía.
- ¿Cuál es el siguiente paso? Gemini 2.5 no es un destino final, sino una etapa intermedia hacia modelos aún más sofisticados. Google ha afirmado que de ahora en adelante, todas sus IAs integrarán capacidades de razonamiento de forma nativa, lo cual sugiere que veremos aplicaciones cada vez más capaces, contextuales y autónomas.
Imagen | Google
–
La noticia
Google lanza Gemini 2.5, su impresionante nueva IA. Gana en todo a sus rivales, pero sigue lejos de la mejor para programar
fue publicada originalmente en
Genbeta
por
Marcos Merino
.