В данной статье представлен DG^VoiC, фреймворк кластеризации голоса, предназначенный для выявления повторяющихся говорящих в анонимизированных аудиозаписях реальных колл-центров с целью помощи в расследовании мошенничества. Метод сочетает анонимизацию, согласованную со_sensitive информацией_, предобработку, ориентированную на речь, извлечение эмбеддингов говорящих скользящим окном и кластеризацию на основе косинусного сходства.
- Оценено на 121 записи с курируемым референсным подмножеством из 56 образцов по 22 кластерам говорящих, согласованным людьми.
- Достигнуто значение AMI 96%, ARI 95%, полноты (completeness) 98%, однородности (homogeneity) 100% и V-меры 99% в лучшей конфигурации.
- Показано, что кластеризация говорящих обеспечивает сильный дополнительный сигнал для проверки согласованности говорящего и выявления повторяющихся голосов среди клиентов.