RedVox: Пробелы в безопасности и справедливости моделей речи на разных языках

Новое исследование выявляет значительные пробелы в безопасности и справедливости многоязычных моделей речи, обнаруживая, что лишь 8% современных релизов документируют какой-либо многоязычный анализ. Чтобы решить эту проблему, авторы представляют RedVox — бенчмарк, основанный на реальных голосах, охватывающий небезопасные запросы на пяти языках.

RedVox оценивает восемь современных моделей с использованием реальных голосов и стереотипных запросов на английском, французском, итальянском, испанском и немецком языках.
Уязвимости сохраняются в неадверсариальных условиях и усиливаются в неанглоязычных языках по сравнению с английским.
Риски возрастают, когда небезопасный запрос подается через голосовой ввод, а не текстовый.
В исследовании документируются проблемы конфиденциальности, связанные со сбором речевых данных от людей.

Это исследование подчеркивает насущную необходимость строгих многоязычных оценок безопасности и рассматривает социо-технические трудности проведения естественных исследований безопасности речи.