Авторы предлагают метод Diffusion Integrated Gradients (DiffIG), новый подход, который переформулирует генерацию путей как задачу условного генеративного моделирования для преодоления ограничений существующих методов атрибуции. Хотя интегрированные градиенты широко используются, их зависимость от фиксированных или вручную сконструированных путей часто приводит к зашумленным или искаженным атрибутам. Для решения этой проблемы DiffIG обучает диффузионную модель для изучения распределения по путям, полученным из процесса Стик-Брейкинг (Stick-Breaking Process). Затем метод использует направленную выборку (guided sampling), чтобы позволить внедрение пользовательских указаний в процедуру сэмплирования во время вывода. Этот подход обеспечивает гибкое и управляемое атрибутирование признаков, рассматривая выбор пути как генеративную задачу, а не статический выбор. Экспериментальные результаты демонстрируют, что DiffIG количественно соответствует или превосходит существующие методы на основе путей с точки зрения качества атрибуции. Кроме того, показано, что сгенерированные объяснения перцептивно согласуются с человеческими ожиданиями. Работа вводит новую генеративную перспективу для объяснимого искусственного интеллекта, поддерживающую динамический контроль над путями объяснений.
Диффузионные интегрированные градиенты: управляемая генерация путей для гибкого атрибутирования признаков
Переведено с English → Русский