La Capsula Informativa: puede que la próxima revolución sean los agentes de IA
Ese pequeño conejito va a tener difícil triunfar. No por ser una mala idea, sino precisamente por lo contrario. Cuando Jesse Lyu presentó su Rabbit R1 nos descubrió el potencial futuro de los chatbots de inteligencia artificial: ya no se conformarían con responder a nuestras preguntas, sino que podrían actuar en consecuencia. Este dispositivo es un ejemplo perfecto de lo que se ha dado en llamar agentes de IA, y aquí es probable que pronto veamos (mucho) movimiento.
Una idea genial. En esa presentación a principios de 2024 el pequeño y original Rabbit R1 demostraba cómo era capaz de reservar un Uber o pedir mesa en un restaurante. Iba por tanto más allá que ChatGPT y sus competidores, porque estos son capaces de decirte cómo ir de un lado a otro o recomendarte un restaurante, pero no pasan de ahí. No actúan.
Agentes de IA. Pero el Rabbit R1 sí lo hace, y el secreto está en su modelo de IA, llamado LAM (Large Action Model), que es una especie de «mayordomo» que se conecta a ciertas plataformas para ejecutar acciones que la otra parte (el chatbot) sugiere. Es como un ChatGPT supervitaminado, porque primero contesta a nuestras preguntas («¿Dónde comer sushi?») y luego actúa en consecuencia («Te voy a reservar mesa en el restaurante X si quieres»). Es lo que hacen los denominados agentes de IA, y todos ellos plantean una interesante revolución en este campo.
Una idea que llegó hace meses. Aunque Rabbit R1 ha sido la demostración más clara de lo que pueden llegar a hacer los agentes de IA, la idea viene de algo antes. Comenzamos a hablar de ellos sin usar ese término hace casi un año, cuando descubrimos AutoGPT. Este modelo de IA, cuyo código está disponibl en GitHub, es un «creador de agentes» que hagan cosas por nosotros. En aquel momento se centraba esencialmente en programar, pero sus opciones van más allá y un agente creado con AutoGPT es por ejemplo capaz de controlar un ordenador usando las mismas entradas y salidas que aprovecharía un usuario humano.
Y van a más. En los últimos días hemos asistido al nacimiento de otro agente de IA prometedor. Se llama Devin y ha sido calificado por sus creadores como «el primer ingeniero de software IA», capaz de detectar y corregir errores de código él solito. Recientemente ha aparecido un competidor para Devin llamado MAGIS, desarrollado por investigadores chinos y que también es capaz de resolver errores en proyectos de GitHub de forma autónoma.
También en videojuegos. Este tipo de modelos de IA también son interesantes en el mundo de los videojuegos. Lo demostró hace dos semanas Google DeepMind al desvelar SIMA, un agente de IA entrenado para aprender a jugar a videojuegos —incluso aquellos en munods abiertos— por sí solo. Según sus proios responsables esta interacción con mundos virtuales puede acabar siendo importante para acabar luego aplicando ese aprendizaje en el mundo real.
En OpenAI (y otros) ya están en ello. Como decíamos, lo malo de tener una buena idea como la de Rabbit es que probablemente alguien te la acaba copiando. Es lo que al parecer hará OpenAI, que según fuentes cercanas a la empresa está preparando «un tipo de agente software que automatiza tareas complejas tomando control efectivo del dispositivo del cliente». Mientras, el exCEO de Salesforce, Bret Taylor, y su socio, Clay Bavor, exdirectivo de Google, preparan también un proyecto llamado Sierra para llevar agentes de IA a las empresas.
Pero tienen que hacerlo bien. El mayor reto a estas alturas no es tanto que los chatbots sean activos y no pasivos, sino que cuando actúen no cometan errores. Tanto ChatGPT como sus rivales meten la pata a menudo e inventan cosas, así que si eso se traduce en acciones en el mundo real las consecuencias podrían ser desastrosas. De momento el Rabbit R1 lo ha resuelto de una forma de lo más lógica: su agente de IA te pregunta antes de hacer nada. Si no confirmas esa reserva del Uber o del restaurante, todo queda como estaba.
Imagen | Darrencoxon con Midjourney
En Xataka | Gemini Nano va a ser una revolución y es lo que quiero que sea Siri en iOS 18