Por fin ha pasado: la IA accesible al usuario medio ha dejado de ser un mero asistente conversacional. OpenAI ha lanzado ChatGPT Agent, una nueva función que transforma al popular chatbot en un trabajador virtual capaz de realizar tareas complejas de principio a fin. ¿La diferencia? Ahora no solo te ayuda con ideas: las ejecuta por ti.
Esta nueva función consiste en una combinación potente de herramientas anteriores de la empresa, como Operator (navegación web automatizada) y Deep Research (síntesis analítica), integradas ahora en un sistema coherente, interactivo y multitarea.
Más allá del ‘asistente’: agente
Imagina que tienes que organizar un viaje o preparar una presentación con datos reales. Antes, necesitabas recurrir a múltiples herramientas, abrir múltiples pestañas y gastar mucho tiempo. Ahora, basta con escribir una instrucción en ChatGPT.
El agente entiende el objetivo, elige las mejores herramientas, navega por sitios web, accede a tu calendario (previa autorización), descarga datos, los analiza y te devuelve el resultado en forma de hoja de cálculo o presentación editable.
¿Qué puede hacer exactamente?
Durante la demostración realizada por OpenAI, el ‘agente’ organizó la asistencia a una boda: buscó hoteles, tuvo en cuenta el clima, recordó que había que comprar un traje, propuso regalos y gestionó reservas. Todo, sin intervención humana directa más allá de la instrucción inicial.
Otros casos de uso destacados incluyen:
- Automatización de tareas laborales: preparar informes financieros, construir modelos de datos, actualizar hojas de cálculo o elaborar presentaciones editables.
- Planificación personal: organizar bodas, vacaciones, cenas o citas médicas.
- Asistencia técnica: ejecutar scripts, realizar análisis web o probar funciones de software.
- Gestión documental: convertir capturas o tablas en presentaciones, reorganizar reuniones, enviar gastos, etc.
Cómo funciona: un cerebro en su propio ordenador virtual
El agente de ChatGPT opera dentro de una máquina virtual segura. En ella puede utilizar:
- Un navegador visual para interactuar con sitios web como lo haría un humano.
- Un navegador de texto para acceder y analizar contenido rápidamente.
- Un terminal para ejecutar comandos y manipular archivos.
- Accesos a APIs (como Gmail, GitHub o Google Calendar).
[Marcos Merino mediante IA]
Este ecosistema le permite combinar acciones como navegar, descargar, filtrar, analizar y presentar, todo en una única conversación continua. Y si el usuario quiere intervenir o supervisar, puede hacerlo en cualquier momento. ChatGPT incluso solicita confirmación explícita antes de realizar acciones críticas, como enviar correos o hacer compras.
¿Y qué hay bajo el capó?
Este agente no usa un modelo genérico como GPT-4o. Según OpenAI, el modelo fue entrenado específicamente para tareas complejas, combinando aprendizaje por refuerzo con herramientas como navegadores y conectores. El sistema ha sido probado con benchmarks exigentes:
- 43,1 en Humanity’s Last Exam, récord absoluto para IA.
- 89,9 % en análisis y 85,5 % en modelado en DSBench (tareas de ciencia de datos).
- 45,5 % en SpreadsheetBench, duplicando el rendimiento de Copilot de Excel.
- 71,3 % de precisión media en tareas de banca de inversión.
En muchos de estos test, el agente ha igualado o incluso superado el rendimiento humano.
Seguridad y privacidad: ¿le damos el control a la IA?
La potencia del agente ha obligado a OpenAI a extremar las precauciones. Por eso, cada acción está sujeta a:
- Confirmación del usuario para operaciones sensibles.
- Supervisión en tiempo real («modo observación») para tareas de riesgo.
- Protección contra ataques por inyección de instrucciones maliciosas (los llamados ‘ataques adversarios’).
- Controles de privacidad y eliminación de datos de navegación con un clic.
Además, los datos introducidos en el navegador remoto no se almacenan, y el agente rechaza tareas que impliquen acciones legales, bancarias o que puedan implicar un daño al usuario o terceros.
¿Qué significa esto para el futuro?
Este no es el anuncio de GPT-5, pero sí es un paso igual de grande. ChatGPT Agent se convierte en el primer sistema comercial de IA capaz de unir razonamiento, acción y ejecución en tiempo real. OpenAI no lo oculta: su objetivo es convertir esta tecnología en el nuevo estándar del trabajo intelectual, y podría convertirse en el primer asalto serio al dominio de herramientas como Excel, PowerPoint o Google Search.
OpenAI promete mejoras periódicas: mejores presentaciones, más integraciones con servicios externos, menor necesidad de supervisión y mayor fluidez en la ejecución. Mientras tanto, el concepto de agente —no solo asistente— gana terreno.
¿Quién puede usarlo y cómo?
ChatGPT Agent está disponible en la mayor parte del mundo, desde ayer mismo, para los usuarios de los planes Pro, Plus y Team. Se activa desde el menú de herramientas de ChatGPT o escribiendo /agent
.
Los usuarios Pro tienen acceso a centenares de tareas al mes, mientras que los de Plus y Team cuentan con 50 tareas mensuales, existiendo la posibilidad de ampliar el uso mediante la compra de créditos. Próximamente, llegará a Enterprise y Education.
Eso sí, por ahora, su despliegue en la Unión Europea y Suiza está pendiente de confirmación por las consabidas cuestiones regulatorias.
Imagen | Marcos Merino mediante IA
En Genbeta | Cada vez más gente percibe que sus IAs funcionan peor: las compañías tienen razones poderosas para que así sea
–
La noticia
ChatGPT deja de ser sólo un chatbot: OpenAI ha lanzado su primer ‘agente de IA’ capaz de trabajar online por ti
fue publicada originalmente en
Genbeta
por
Marcos Merino
.