CapRiCorn-1K — это бенчмарк, который оценивает качество описания видео и согласованность ссылок на предмет в различных длительностях и областях видео. Он поддерживает как аудиовизуальные, так и визуальные настройки, показывая, что текущие модели не могут поддерживать согласованность ссылок на предмет, особенно в более длинных видео, при этом качество и согласованность описаний снижаются с увеличением продолжительности видео. Метрики бенчмарка показывают сильную согласованность с задачами, которые идут после, что подтверждает их эффективность.
CapRiCorn-1K: Бенчмарк для описания видео и согласованности темы
Переведено с English → Русский