KARLA: Дополнение базы знаний для извлечения информации языковыми моделями

Авторы предлагают KARLA — метод, позволяющий большим языковым моделям автоматически извлекать фактические знания из внешней базы знаний во время генерации токенов. Этот подход позволяет обновлять факты без переобучения модели и обеспечивает прослеживаемость результатов до исходных данных.

Основной механизм включает обучение модели генерации специальных токенов, которые инициируют запросы к базе знаний.
Фактические изменения могут применяться через редактирование базы знаний, а не путем обновления параметров модели.
Метод позволяет меньшим моделям достигать фактической точности, сопоставимой с большими моделями.
Эксперименты демонстрируют улучшение фактического обоснования как при генерации коротких, так и длинных текстов.

Этот подход повышает прозрачность и объяснимость за счет прослеживаемости фактов к базе знаний, а также позволяет эффективно обновлять данные без необходимости дорогостоящего переобучения параметров.