SVD-Surgeon: Cirugía óptima de valores singulares para la compresión de modelos de lenguaje grandes
Los investigadores han presentado SVD-Surgeon, un método sin entrenamiento que aplica el marco Optimal Brain Surgeon a la descomposición en valores singulares para comprimir modelos de lenguaje grandes. Este enfoque calcula actualizaciones de forma cerrada para los valores singulares retenidos con el fin de compensar los errores de truncamiento y determina qué valores deben podarse basándose en su relevancia.