La IA del agente sigue siendo propensa a errores humanos

Dado que la IA de los agentes sigue siendo una fuerza que da forma al futuro de las compras, Microsoft llevó a cabo un experimento para probar su eficacia: ejecutando varios agentes de IA en un mercado simulado. Las investigaciones han descubierto que estos agentes son fácilmente manipulables y tienden a quedarse estancados cuando se enfrentan a demasiadas opciones, al igual que los humanos. Resulta que la tecnología aún está muy lejos de ser adoptada de forma generalizada.
El experimento utilizó 100 clientes virtuales y 300 negocios virtuales para modelar transacciones como pedir comida o contratar servicios de mejoras para el hogar. Cada cliente tiene una lista de los artículos deseados y los servicios necesarios para una transacción satisfactoria.
La buena noticia es que tanto los modelos propietarios avanzados como los sistemas de código abierto superan las líneas de base simples, p. Elige aleatoriamente o elige siempre la opción más barata. GPT-5 es el modelo proxy con mejor rendimiento y logra resultados casi óptimos.
confundido por la complejidad
A medida que los escenarios se volvieron más complejos, Microsoft descubrió que los resultados se volvían menos impresionantes. Cargar un agente de IA con más opciones y resultados de búsqueda en realidad reduce la cantidad de comparaciones que tiene que hacer, ya que el modelo tiende a elegir la primera opción “suficientemente buena”. Con la excepción de GPT-5 y Gemini-2.5-Flash, el agente finalmente contactó solo a un pequeño subconjunto de empresas disponibles. En un caso, un modelo contactó repetidamente a empresas que no proporcionaban los bienes o servicios que los clientes querían.
Los agentes de IA también son fácilmente manipulados por los sitios web que buscan, lo que significa que las tácticas de marketing que influyen en los compradores humanos también pueden funcionar con bots. Microsoft concluyó: “Los agentes deberían ayudar, no reemplazar, la toma de decisiones humana”.
Los compradores siguen sin estar convencidos
Según Javelin Strategy & Research, muchas personas han probado o considerado utilizar un agente de IA, pero todavía no están convencidas de que vaya a mejorar sus vidas. La investigación de Microsoft muestra que los agentes de IA todavía tienen un largo camino por recorrer antes de que se conviertan en una parte natural de la vida diaria de los consumidores.
“Hay pruebas muy sólidas de que los consumidores están interesados en utilizar herramientas similares al chat para considerar las compras”, dijo Christopher Miller, analista principal de pagos emergentes de Javelin. “Existe alguna evidencia de que están dispuestos a completamente Las compras se hacían a través de sus agentes, aunque las cantidades originales eran muy, muy pequeñas. Pero si nunca ha decidido que ChatGPT es su primera parada para obtener información y continúa navegando por Google, las posibilidades no son tan grandes como algunos podrían pensar. “



