Диалог к обнаружению: мультимодальный гибридный NLP-конвейер для выявления мошенничества со страховыми выплатами

В данной статье представлен синтетический мультимодальный фреймворк, предназначенный для репликации условий подачи первоначального заявления о потере (FNOL) при выявлении страховых мошенничеств, что позволяет преодолеть ограничения существующих подходов, основанных исключительно на тексте. Система генерирует транскрипты диалогов между агентом и клиентом, а также аудиозаписи с двумя говорящими для интеграции лингвистических, поведенческих и голосовых индикаторов.

Генерирует синтетические транскрипты диалогов агент-клиент и аудиозаписи с двумя говорящими для репликации сценариев FNOL.
Выполняет автоматическое распознавание речи (ASR) и диааризацию на сгенерированных аудио данных.
Объединяет NER, извлечение признаков на основе регулярных выражений, LLM-RAG retrieval и спикерные эмбеддинги в риск-скор по правилам.
Выявляет повторное использование нарративов, структурные несоответствия и повторение голоса между делами, балансируя чувствительность и ложноположительные срабатывания.

Фреймворк предлагает воспроизводимую базовую линию для выявления мошенничества, выходящую за рамки методов, основанных только на тексте; валидация набора данных демонстрирует стабильность и потенциал переноса.