Мягкое подсказывание для соблюдения языка в мультимодальных LLM

Предлагается подход мягких подсказок для улучшения соблюдения языка в мультимодальных LLM без строгих ограничений на выход. Метод вводит новый метрику для количественной оценки нарушений языка и оценивает три стратегии: нулевой подсказки, надзирательной настройки и рассуждения цепочкой мыслей. Результаты показывают эффективность в снижении нарушений языка при сохранении производительности ASR на разных языках, с рассмотрением компромиссов при различных ограничениях вычислительных ресурсов.