Los autores proponen KARLA, un método que permite a los grandes modelos de lenguaje recuperar automáticamente conocimiento factual de una base de conocimientos externa durante la generación de tokens. Este enfoque permite actualizaciones factuales sin reentrenar el modelo y garantiza que las salidas sean rastreables hasta los datos de origen.

  • El mecanismo central implica entrenar al modelo para generar tokens especiales que desencadenen consultas a la base de conocimientos.
  • Las revisiones factuales pueden aplicarse mediante ediciones en la base de conocimientos en lugar de actualizar los parámetros del modelo.
  • El método permite que modelos más pequeños logren una precisión factual comparable a la de modelos más grandes.
  • Los experimentos demuestran una mejor fundamentación factual tanto en la generación de texto corto como largo.

Este enfoque mejora la transparencia y explicabilidad al rastrear los hechos hasta una base de conocimientos, mientras también permite actualizaciones eficientes sin necesidad de costoso reentrenamiento de parámetros.