De diálogo a detección: una canalización híbrida multimodal de PLN para la detección de fraude en seguros

Este artículo presenta un marco sintético multimodal diseñado para replicar las condiciones del Primer Aviso de Pérdida (FNOL) para la detección de fraude en seguros, abordando las limitaciones de los enfoques existentes basados únicamente en texto. El sistema genera transcripciones de diálogos entre agente y cliente y audios de dos hablantes para integrar indicadores lingüísticos, conductuales y basados en el hablante.

Genera transcripciones sintéticas de diálogos entre agente y cliente y audios de dos hablantes para replicar escenarios FNOL.
Realiza Reconocimiento Automático del Habla (ASR) y diarización sobre los datos de audio generados.
Combina NER, extracción de características basada en regex, recuperación LLM-RAG e incrustaciones de hablante en una puntuación de riesgo basada en reglas.
Señala la reutilización narrativa, inconsistencias estructurales y repetición de voz entre casos mientras equilibra la sensibilidad y los falsos positivos.

El marco ofrece una línea base reproducible para la detección de fraude que se extiende más allá de los métodos basados únicamente en texto, con validación del conjunto de datos que demuestra estabilidad y potencial de transferencia.