Los investigadores presentan DyadEE, un conjunto de datos para detectar arrastre emocional en habla diádica, y proponen TRACE, un marco a nivel de ventana que modela estas interacciones como secuencias ordenadas de incrustaciones acústicas. El estudio demuestra que incorporar el contexto conversacional y la información de la relación mejora significativamente la precisión de la detección.
- El conjunto de datos DyadEE contiene tanto conversaciones emocionalmente arrastradas como interacciones sintéticas con arrastre interrumpido mediante el intercambio de parejas y la resíntesis de emociones.
- TRACE trata cada muestra como un rastro de interacción utilizando representaciones de Whisper afinadas para emociones en lugar de enunciados agrupados.
- El modelo alcanza una precisión máxima del 97.01% en el conjunto de datos DyadEE aprovechando el modelado consciente de la relación temporal.