Сегментация BEV с открытым словарем на основе 3D-геометрических ограничений
Авторы представляют OVBEVSeg, фреймворк для сегментации вида сверху (BEV) с открытым словарем, который использует модели «зрение-язык» для распознавания категорий за пределами обучающего набора, сохраняя при этом эффективность в реальном времени. Чтобы устранить 3D-геометрическую несогласованность, присущую подъему 2D-семантики в BEV, метод применяет надежные 3D-геометрические ограничения на трех прогрессивных этапах.