DG^VoiC: Кластеризация говорящих для расследования мошенничества в условиях реальных колл-центров
В данной статье представлен DG^VoiC, фреймворк кластеризации голоса, предназначенный для выявления повторяющихся говорящих в анонимизированных аудиозаписях реальных колл-центров с целью помощи в расследовании мошенничества. Метод сочетает анонимизацию, согласованную со_sensitive информацией_, предобработку, ориентированную на речь, извлечение эмбеддингов говорящих скользящим окном и кластеризацию на основе косинусного сходства.