Codificador de voz a pico aprendible para Redes Neuronales Espigadas
Un codificador residual de voz a pico aprendible se entrena conjuntamente con una red Recurrent Leaky Integrate-and-Fire, alcanzando hasta un 94.97% de precisión en el benchmark Google Speech Commands v2. Una versión de 35k parámetros alcanza el 89.8%, superando a métodos anteriores con muchos menos parámetros, y muestra representaciones de pico alineadas con la tarea que mejoran la separabilidad de clases.