Данное исследование изучает использование больших языковых моделей для обнаружения мошеннических телефонных звонков на турецком языке — языке с низким уровнем ресурсности, где аннотированные данные отсутствуют.
- Оценены семь LLM из трех семейств: Gemini 2.5 (Flash, Flash-Lite, Pro), GPT-4o и Qwen (Max, Plus, Turbo).
- Протестированы три условия ввода: сырое аудио, автоматические транскрипции speech-to-text и транскрипции, уточненные носителем языка.
- Выявлено, что ввод на основе транскрипций стабильно превосходит прямую обработку аудио.
- Замечено, что исправленные человеком и не исправленные транскрипции показывают сопоставимые результаты.
Работа подчеркивает острую необходимость в культурно и лингвистически инклюзивных исследованиях безопасности ИИ, а также более надежных мультимодальных системах для предотвращения мошенничества.