Новое исследование выявляет значительные пробелы в безопасности и справедливости многоязычных моделей речи, обнаруживая, что лишь 8% современных релизов документируют какой-либо многоязычный анализ. Чтобы решить эту проблему, авторы представляют RedVox — бенчмарк, основанный на реальных голосах, охватывающий небезопасные запросы на пяти языках.
- RedVox оценивает восемь современных моделей с использованием реальных голосов и стереотипных запросов на английском, французском, итальянском, испанском и немецком языках.
- Уязвимости сохраняются в неадверсариальных условиях и усиливаются в неанглоязычных языках по сравнению с английским.
- Риски возрастают, когда небезопасный запрос подается через голосовой ввод, а не текстовый.
- В исследовании документируются проблемы конфиденциальности, связанные со сбором речевых данных от людей.
Это исследование подчеркивает насущную необходимость строгих многоязычных оценок безопасности и рассматривает социо-технические трудности проведения естественных исследований безопасности речи.