Los grandes modelos de lenguaje (LLM) han dejado de ser simples asistentes para transformarse en agentes de IA casi autónomos, capaces de resolver problemas complejos, ejecutar aplicaciones, y ajustar su comportamiento en respuesta a su entorno. Estos agentes pueden ahora realizar tareas como buscar en la web o resolver problemas matemáticos, actuando sobre los prompts de los usuarios para verificar y corregir su trabajo.
"El agente está saliendo del chat y ayudándote a asumir tareas cada vez más complejas", comenta Maya Murad, gerente de incubación de productos en IBM Research. Este cambio está inaugurando un nuevo paradigma en la experiencia de usuario, permitiendo a los LLMs planificar, actuar y mejorar su rendimiento a través de bucles de autocrítica.
Los agentes de IA construidos sobre LLMs están diseñados para manejar tareas de forma más eficiente al seleccionar y coordinar herramientas externas, un enfoque conocido como orquestación. Este enfoque les permite descomponer tareas complejas en subtareas, formular un plan, y realizar ajustes en función de la retroalimentación.
Sin embargo, a medida que los LLMs ganan más autonomía, también aumentan los riesgos. La capacidad de escribir y ejecutar código, por ejemplo, puede llevar a errores críticos o a la divulgación de información confidencial. Para mitigar estos riesgos, es esencial implementar salvaguardias como la ejecución de código en entornos seguros y la aplicación de pruebas adversariales.
En IBM Research, los ingenieros están mejorando las capacidades de razonamiento y función de llamada de los modelos Granite de código abierto de IBM, mientras desarrollan métodos para evaluar la seguridad y los sesgos en los LLMs. Estos avances ya están siendo reconocidos, con los modelos Granite obteniendo altas puntuaciones en el Índice de Transparencia de Modelos de Fundación de la Universidad de Stanford, y el agente de codificación de IBM, Agent-101, alcanzando el top 10 en un benchmark de programación de Princeton.
Con el desarrollo continuo de agentes de IA y la mejora en su capacidad para interactuar con el mundo exterior, el futuro de la automatización inteligente está a punto de dar un salto significativo. Sin embargo, antes de que estos agentes entren en acción, los ingenieros tienen trabajo por delante para garantizar su seguridad y confiabilidad.
En esta nota
IBM
IBM, International Business Machines Corporation, es una empresa multinacional líder en tecnología y servicios de consultoría.