В данной статье представлен синтетический мультимодальный фреймворк, предназначенный для репликации условий подачи первоначального заявления о потере (FNOL) при выявлении страховых мошенничеств, что позволяет преодолеть ограничения существующих подходов, основанных исключительно на тексте. Система генерирует транскрипты диалогов между агентом и клиентом, а также аудиозаписи с двумя говорящими для интеграции лингвистических, поведенческих и голосовых индикаторов.
- Генерирует синтетические транскрипты диалогов агент-клиент и аудиозаписи с двумя говорящими для репликации сценариев FNOL.
- Выполняет автоматическое распознавание речи (ASR) и диааризацию на сгенерированных аудио данных.
- Объединяет NER, извлечение признаков на основе регулярных выражений, LLM-RAG retrieval и спикерные эмбеддинги в риск-скор по правилам.
- Выявляет повторное использование нарративов, структурные несоответствия и повторение голоса между делами, балансируя чувствительность и ложноположительные срабатывания.
Фреймворк предлагает воспроизводимую базовую линию для выявления мошенничества, выходящую за рамки методов, основанных только на тексте; валидация набора данных демонстрирует стабильность и потенциал переноса.