Данное исследование изучает использование больших языковых моделей для обнаружения мошеннических телефонных звонков на турецком языке — языке с низким уровнем ресурсности, где аннотированные данные отсутствуют.

  • Оценены семь LLM из трех семейств: Gemini 2.5 (Flash, Flash-Lite, Pro), GPT-4o и Qwen (Max, Plus, Turbo).
  • Протестированы три условия ввода: сырое аудио, автоматические транскрипции speech-to-text и транскрипции, уточненные носителем языка.
  • Выявлено, что ввод на основе транскрипций стабильно превосходит прямую обработку аудио.
  • Замечено, что исправленные человеком и не исправленные транскрипции показывают сопоставимые результаты.

Работа подчеркивает острую необходимость в культурно и лингвистически инклюзивных исследованиях безопасности ИИ, а также более надежных мультимодальных системах для предотвращения мошенничества.