Los autores proponen KARLA, un método que permite a los grandes modelos de lenguaje recuperar automáticamente conocimiento factual de una base de conocimientos externa durante la generación de tokens. Este enfoque permite actualizaciones factuales sin reentrenar el modelo y garantiza que las salidas sean rastreables hasta los datos de origen.
- El mecanismo central implica entrenar al modelo para generar tokens especiales que desencadenen consultas a la base de conocimientos.
- Las revisiones factuales pueden aplicarse mediante ediciones en la base de conocimientos en lugar de actualizar los parámetros del modelo.
- El método permite que modelos más pequeños logren una precisión factual comparable a la de modelos más grandes.
- Los experimentos demuestran una mejor fundamentación factual tanto en la generación de texto corto como largo.
Este enfoque mejora la transparencia y explicabilidad al rastrear los hechos hasta una base de conocimientos, mientras también permite actualizaciones eficientes sin necesidad de costoso reentrenamiento de parámetros.