Un asistente de búsqueda de alquileres con LLMs y soporte multi-mercado enfrentó defectos persistentes de usuarios a pesar de 1,553 pruebas automatizadas exitosas. El análisis de 252 commits de corrección de errores mostró que el 44% resolvió problemas en cuatro costuras no vistas: tiempo de ejecución del navegador en vivo, mercado no predeterminado, flujos de extremo a extremo y nivel de sistema completo. Se adoptó una práctica simple para identificar la costura con más correcciones.
Las Costuras de Errores en Aplicaciones Integradas con LLM Revelan Lagunas en las Pruebas
Traducido del English → Español