В статье представлен Action-BED, новая рамка для байесовского экспериментального дизайна, которая формулирует задачу через ожидаемые будущие потери на последующих действиях, а не через уменьшение неопределенности. Этот подход преобразует традиционно двукратно некорректные целевые функции в однократно некорректные, которые можно совместно оптимизировать с помощью стохастических градиентов.

  • Метод избегает явного оценивания апостериорного распределения или маргинальной правдоподобности, полагаясь только на выборку из совместной модели и оценку функции потерь последующих действий.
  • Он позволяет совместно оптимизировать как политику дизайна, так и политику последующего действия с помощью стохастических градиентов.
  • Такая формулировка обеспечивает более простую кастомизацию под различные последующие задачи и функции потерь по сравнению с существующими методами.

Этот подход позволяет эффективнее, быстрее и проще обучать политики дизайна, обеспечивая при этом легкую адаптацию к различным последующим задачам.