HilDA представляет собой самообучающуюся предобучающую рамку для LiDAR-архитектур, использующую иерархическое дистиллирование и диффузионное временной занятости для улучшения семантического и геометрического понимания. Оно достигает лучших результатов на бенчмарках дистиллирования межмодальных данных и превосходит предыдущие методы по 3D-обнаружению объектов, прогнозированию сцены и семантического заполнения.