Memoria Procedural Neural: Potenciando Agentes LLM con Dirección de Activación Implícita

El artículo presenta Memoria Procedural Neural (NPM), un marco sin entrenamiento que permite a los agentes de Modelos de Lenguaje Grande utilizar la dirección de activación implícita para memoria procedural en lugar de depender de instrucciones textuales explícitas. Al destilar habilidades de experiencias históricas en vectores de dirección, NPM activa directamente mecanismos neuronales relevantes para la tarea para guiar la ejecución.

NPM representa la memoria del agente a través de dirección de activación implícita en lugar de directrices de Generación Aumentada por Recuperación (RAG).
Las habilidades procedurales se destilan de experiencias contrastivas históricas en vectores de dirección dentro del espacio de activación.
Las evaluaciones en cuatro benchmarks de agentes muestran un rendimiento comparable a las líneas base que utilizan instrucciones textuales explícitas.
Combinar la dirección implícita con flujos de trabajo explícitos proporciona ventajas complementarias para una ejecución de tareas más robusta.
Los análisis representacionales indican que los vectores de dirección codifican lógica de tarea consistente y forman estructuras organizadas en el espacio de activación.

Los autores consideran esto significativo porque aborda la desconexión texto-acción encontrada en métodos de instrucción simbólica, ofreciendo un enfoque prometedor para gestionar la memoria del agente a través de la activación directa de mecanismos neuronales.