Cualquier tipo de relación evoluciona cuando se basa en la confianza. Se concede autonomía confiando en que la otra parte cumplirá lo acordado. Cuando esto ocurre, la confianza aumenta. Esta reflexión es válida para parejas, compañeros de trabajo, empresas y… sistemas que «piensan». No es de extrañar que la autonomía de los agentes de inteligencia artificial sea uno de los criterios para medir el poder de este tipo de aplicaciones.
En el ámbito empresarial, cuando un compañero finaliza su parte del trabajo según lo acordado, otro puede continuar con la tarea. La seguridad de que todo se ha hecho como se esperaba viene dada por los criterios de calidad de cada proceso.
En el caso de las aplicaciones de inteligencia artificial, el principio es el mismo. Los agentes, por definición, cuentan con cierto grado de autonomía, que es aún mayor en la inteligencia artificial agencial. El reto consiste en garantizar que esa libertad no comprometa la precisión. Son las prácticas de calidad aplicadas a la IA las que garantizan que el comportamiento de la aplicación cumpla los criterios de calidad sin menoscabar la autonomía de los agentes de inteligencia artificial.
En este texto vamos a explicar con más detalle esta capacidad de los sistemas de IA y cómo la ajustamos para encontrar el equilibrio perfecto entre la ausencia de alucinaciones, la precisión de las respuestas y el comportamiento «social» del agente.
Como explicamos en un artículo publicado recientemente aquí, en el blog de Inmetrics, los agentes de inteligencia artificial tienen habilidades y capacidades casi «humanas». Una de las principales es la de aprender, ya que sus modelos están diseñados como redes neuronales artificiales.
Las tareas pueden realizarse de muchas maneras diferentes. Volvamos al ejemplo de los compañeros de trabajo: lo que da seguridad al segundo de que el primero ha completado su fase cumpliendo los criterios establecidos es el hecho de que ambos conocen cuáles son esos criterios y de que el primero tiene los conocimientos necesarios para cumplirlos. Unos conocimientos que ha adquirido en cursos de formación y capacitación.
Los agentes de inteligencia artificial pasan por un proceso similar: se les entrena de forma masiva para que aprendan a funcionar de acuerdo con los patrones establecidos. Para validar lo aprendido, recurrimos a ciclos de pruebas.
Sin embargo, unos criterios demasiado estrictos en cada pequeño segmento de las tareas limitan la capacidad de autonomía de los agentes, lo que los hace más parecidos a aplicaciones «no inteligentes». Para que quede más claro, basta con comparar los chatbots con y sin inteligencia artificial. Al interactuar con el usuario, los primeros solo estarán preparados para recibir respuestas predefinidas: «sí» o «no», un número con una determinada cantidad de dígitos… No sabrán procesar, por ejemplo, un cambio en el CNPJ. Por su parte, los chatbots equipados con LLM procesan el lenguaje natural, almacenan memoria y comprenden el contexto. Gracias a su autonomía, son capaces de resolver problemas más impredecibles. Sin embargo, esta también puede llevarles a dar respuestas imprecisas, afectando así a los criterios de calidad establecidos para esos agentes.
Como ya hemos explicado, la arquitectura de las aplicaciones de inteligencia artificial se basa en redes neuronales, y los LLM actúan como controladores del sistema. Estos configuran e integran los módulos de la aplicación.
En términos generales, los agentes de IA cuentan con cuatro grupos de módulos:
La autonomía de los agentes de inteligencia artificial no está controlada por un único módulo: viene determinada por la configuración del conjunto de todos ellos y, sobre todo, por el nivel de acceso que cada uno tendrá sobre los demás. Las aplicaciones de IA con una amplia gama de herramientas y mucha autonomía pueden hacer cosas que no estaban previstas inicialmente y actuar «fuera de control», como, por ejemplo, crear una red social compuesta únicamente por robots o incluso «ciudadanos falsos» en masa, infiltrándose en las redes sociales e influyendo de manera significativa en la opinión pública.
Por su parte, los agentes con pocas herramientas y poca autonomía se limitarán a realizar tareas de baja complejidad, como buscar información en Internet o generar bloques de código sencillos.
El punto exacto en el que se logra la autonomía de los agentes de inteligencia artificial sin que ello afecte a la precisión de sus resultados se encuentra, al igual que en cualquier otra aplicación, mediante pruebas. Las rutinas periódicas de pruebas automatizadas —una práctica de la calidad como servicio— inspeccionan el código para comprobar cómo funciona la coordinación entre los módulos de los agentes y qué nivel de acceso tiene cada uno sobre los demás.
En las inspecciones, las pruebas verifican la cantidad y la profundidad de los controles «Human-in-the-Loop», que podrían traducirse libremente como «humanos en el flujo»: la asignación a los humanos de responsabilidades explícitas, ya sea en la supervisión, la interpretación, la ampliación o la anulación de las decisiones de los agentes de IA, sobre todo cuando estos comienzan a mostrar comportamientos que se alejan de los criterios de calidad.
Si desea integrar aplicaciones de IA en los sistemas de su empresa, pero tiene dudas sobre el nivel de acceso y autonomía que tendrán los agentes de inteligencia artificial, ¡póngase en contacto con nosotros! En nuestra unidad de Consultoría, Datos e IA, nos dedicamos a la implementación de agentes sobre los que usted tiene un control total, lo que garantiza que su funcionamiento se ajuste a los criterios de calidad establecidos. Nuestros especialistas estarán encantados de resolver todas sus dudas, ¡solo tiene que ponerse en contacto con nosotros!