Action-BED: Задачно-ориентированный байесовский экспериментальный дизайн с однократно некорректными целевыми функциями

В статье представлен Action-BED, новая рамка для байесовского экспериментального дизайна, которая формулирует задачу через ожидаемые будущие потери на последующих действиях, а не через уменьшение неопределенности. Этот подход преобразует традиционно двукратно некорректные целевые функции в однократно некорректные, которые можно совместно оптимизировать с помощью стохастических градиентов.

Метод избегает явного оценивания апостериорного распределения или маргинальной правдоподобности, полагаясь только на выборку из совместной модели и оценку функции потерь последующих действий.
Он позволяет совместно оптимизировать как политику дизайна, так и политику последующего действия с помощью стохастических градиентов.
Такая формулировка обеспечивает более простую кастомизацию под различные последующие задачи и функции потерь по сравнению с существующими методами.

Этот подход позволяет эффективнее, быстрее и проще обучать политики дизайна, обеспечивая при этом легкую адаптацию к различным последующим задачам.