KARLA: Recuperación aumentada con base de conocimientos para modelos de lenguaje

Los autores proponen KARLA, un método que permite a los grandes modelos de lenguaje recuperar automáticamente conocimiento factual de una base de conocimientos externa durante la generación de tokens. Este enfoque permite actualizaciones factuales sin reentrenar el modelo y garantiza que las salidas sean rastreables hasta los datos de origen.

El mecanismo central implica entrenar al modelo para generar tokens especiales que desencadenen consultas a la base de conocimientos.
Las revisiones factuales pueden aplicarse mediante ediciones en la base de conocimientos en lugar de actualizar los parámetros del modelo.
El método permite que modelos más pequeños logren una precisión factual comparable a la de modelos más grandes.
Los experimentos demuestran una mejor fundamentación factual tanto en la generación de texto corto como largo.

Este enfoque mejora la transparencia y explicabilidad al rastrear los hechos hasta una base de conocimientos, mientras también permite actualizaciones eficientes sin necesidad de costoso reentrenamiento de parámetros.