Los agentes de IA están arrasando, pero nadie sabe qué hacen exactamente

Los agentes son uno de los temas más candentes en el campo de la inteligencia artificial (IA) y, desde principios de año, las empresas de esta industria han ido una tras otra lanzando sus respectivas apuestas por esta tecnología.
Sin embargo, en el sector nadie se pone de acuerdo para delimitar qué es exactamente lo que hacen estas herramientas.
En enero, OpenAI lanzó Operator, un agente que puede navegar por internet, reservar billetes de avión o generar memes. Compañías como Glean o Cohere, dedicadas al software empresarial, han presentado plataformas que permiten a los trabajadores de una determinada organización crear e implementar agentes. Y, a principios de este mes, la startup china Butterfly Effect causó un gran revuelo al presentar Manus, un agente de IA parecido a la propuesta de DeepSeek que puede analizar acciones, extraer datos de internet e, incluso, crear páginas web interactivas.
Los agentes suelen ser definidos como asistentes virtuales que pueden completar tareas de forma autónoma. Desglosan problemas, esbozan planes y actúan sin que se lo pida ningún usuario en particular.
Parte de la emoción que les rodea es que podrían ser el primer paso hacia un mundo sin manos en el que los seres humanos pueden sentarse, relajarse y ver cómo la inteligencia artificial hace todo el trabajo. En cambio, los expertos en IA que trabajan con sistemas de agentes dicen que esta tecnología es algo más compleja.
«He oído definiciones de agentes en las que algo solo es un agente si realiza acciones», ha asegurado Douwe Kiela, cofundador y consejero delegado de Contextual AI, una empresa que ayuda a sus clientes corporativos a crear e implementar agentes RAG. Antes, Kiela dirigió el equipo de Meta (Facebook) que desarrolló la generación aumentada por recuperación, o RAG (por sus siglas en inglés), una técnica de inteligencia artificial que mejora los resultados de los grandes modelos lingüísticos (LLM).
«Piensa en Deep Research», ha planteado este investigador a Business Insider, refiriéndose a los agentes desarrollados por OpenAI, Perplexity y Google que sintetizan cientos de fuentes de información online en informes detallados. «Eso no necesariamente realiza ninguna acción además de la búsqueda, pero, ¿es eso un agente? Yo diría que sí, pero mucha gente dice que no; tiene que llevar a cabo acciones que de alguna manera afecten el estado o el entorno en el que opera el agente».
La definición correcta de agente simplemente es algo que «razona activamente», ha explicado Kiela. «Así que, si comete un error, puede detectarlo y volver a intentarlo».
Satya Nitta, experta en lenguaje natural y CEO de Emergence AI, una compañía especializada en sistemas multiagente, ha declarado a este medio de comunicación que los agentes están diseñados para solucionar problemas incluso cuando su entorno evoluciona constantemente.
Los agentes van «más allá de la automatización, demostrando que pueden razonar de forma contextual, adaptándose a desafíos imprevistos y ajustando dinámicamente sus planes para tener éxito en entornos complejos», ha señalado Nitta.
Otra forma de pensar en los agentes de IA es en relación con los LLM, que sirven de base para los chatbots como ChatGPT.
«Un gran modelo lingüístico es un nombre inapropiado. Debería llamarse realmente modelo de secuencia neuronal, que se aplica a cualquier dato secuencial: lenguaje natural, lenguajes de programación, secuencias de píxeles y secuencias biológicas (proteínas)», ha indicado Richard Socher, fundador y consejero delegado de You.com (un motor de búsqueda basado en inteligencia artificial para los denominados empleados del conocimiento), a Business Insider. Un agente, por otro lado, sería «un modelo de secuencia neuronal que puede realizar acciones por ti, aprendiendo de patrones de comportamiento humano para automatizar tareas complejas en diversos ámbitos».
A medida que los agentes cojan cada vez más fuerza en el lugar de trabajo, la gente puede empezar a pensar en ellos como miembros del equipo o asistentes autorizados, pero Spence Green, CEO de la empresa de traducción LILT —cuya plataforma está impulsada por IA— y especialista en el procesamiento del lenguaje natural, ha matizado: «Pienso en ellos como diseñadores de flujos de trabajo».
Sea como sea que se definan y hagan lo que hagan, las organizaciones que se dedican a la inteligencia artificial están apostando fuerte por los agentes para impulsar sus beneficios.
The Information publicaba este mes que OpenAI tiene intención de poner a disposición de sus clientes agentes con nivel de doctorado a partir de 20.000 dólares al mes —unos 18.400 euros al tipo de cambio actual— y, de cara al futuro, la desarrolladora de ChatGPT espera que entre un 20% y un 25% de sus ingresos provengan de esta tecnología.
«Si 2024 fue el año de los LLM, creemos que 2025 será el año de la IA agencial«, comentaba en su día Praveen Akkiraju, director general de Insight Partners, a este medio de comunicación.