Este artículo presenta DG^VoiC, un marco de agrupación de voz diseñado para identificar hablantes repetidos en audio real de centros de llamadas anonimizado, con el fin de asistir en la investigación de fraude. El método combina anonimización alineada con información sensible, preprocesamiento centrado en el habla, extracción de incrustaciones de hablante mediante ventana deslizante y agrupación basada en similitud coseno.
- Evaluado en 121 grabaciones con un subconjunto de referencia curado de 56 muestras a través de 22 grupos de hablantes acordados por humanos.
- Logró 96% AMI, 95% ARI, 98% completitud, 100% homogeneidad y 99% V-medida en la mejor configuración.
- Demuestra que la agrupación de hablantes proporciona una señal adicional sólida para verificar la consistencia del hablante y revelar voces repetidas entre clientes.