В статье представлен Action-BED, новая рамка для байесовского экспериментального дизайна, которая формулирует задачу через ожидаемые будущие потери на последующих действиях, а не через уменьшение неопределенности. Этот подход преобразует традиционно двукратно некорректные целевые функции в однократно некорректные, которые можно совместно оптимизировать с помощью стохастических градиентов.
- Метод избегает явного оценивания апостериорного распределения или маргинальной правдоподобности, полагаясь только на выборку из совместной модели и оценку функции потерь последующих действий.
- Он позволяет совместно оптимизировать как политику дизайна, так и политику последующего действия с помощью стохастических градиентов.
- Такая формулировка обеспечивает более простую кастомизацию под различные последующие задачи и функции потерь по сравнению с существующими методами.
Этот подход позволяет эффективнее, быстрее и проще обучать политики дизайна, обеспечивая при этом легкую адаптацию к различным последующим задачам.