Постер: Исследование пределов обнаружения турецких телефонных мошеннических звонков на основе аудио

Данное исследование изучает использование больших языковых моделей для обнаружения мошеннических телефонных звонков на турецком языке — языке с низким уровнем ресурсности, где аннотированные данные отсутствуют.

Оценены семь LLM из трех семейств: Gemini 2.5 (Flash, Flash-Lite, Pro), GPT-4o и Qwen (Max, Plus, Turbo).
Протестированы три условия ввода: сырое аудио, автоматические транскрипции speech-to-text и транскрипции, уточненные носителем языка.
Выявлено, что ввод на основе транскрипций стабильно превосходит прямую обработку аудио.
Замечено, что исправленные человеком и не исправленные транскрипции показывают сопоставимые результаты.

Работа подчеркивает острую необходимость в культурно и лингвистически инклюзивных исследованиях безопасности ИИ, а также более надежных мультимодальных системах для предотвращения мошенничества.