Gradientes Integrados de Difusión: Generación Controlada de Trayectorias para Atribución Flexible de Características

Los autores proponen Gradientes Integrados de Difusión (DiffIG), un método novedoso que reformula la generación de trayectorias como un problema de modelado generativo condicional para abordar limitaciones en las técnicas de atribución existentes. Si bien los gradientes integrados se utilizan ampliamente, su dependencia de trayectorias fijas o elaboradas a mano a menudo da lugar a atribuciones ruidosas o distorsionadas. Para resolver esto, DiffIG entrena un modelo de difusión para aprender una distribución sobre trayectorias derivadas de un Proceso de Ruptura de Palitos (Stick-Breaking Process). El método emplea luego muestreo guiado para permitir la incorporación de orientación del usuario durante el procedimiento de muestreo en tiempo de inferencia. Este enfoque permite una atribución de características flexible y controlable al tratar la selección de trayectorias como una tarea generativa en lugar de una elección estática. Los resultados experimentales demuestran que DiffIG coincide cuantitativamente o supera a los métodos basados en trayectorias existentes en términos de calidad de atribución. Además, se muestra que las explicaciones generadas están alineadas perceptualmente con las expectativas humanas. El trabajo introduce una nueva perspectiva generativa para la Inteligencia Artificial Explicable que admite el control dinámico sobre las trayectorias de explicación.