Языковые модели как базы знаний для конкретных задач: анализ интерпретируемости

В данном исследовании изучается, функционируют ли языковые модели как последовательные базы знаний, анализируя, остаются ли факты, полученные в ходе одной задачи, доступными в других. Исследование показывает, что языковые модели кодируют знания специфичным для задачи образом, при этом различные подмножества параметров лежат в основе разных задач для одного и того же факта.

Факты, полученные в ходе одной задачи, часто не появляются совместно с другими в процессе обучения.
Эксперименты по локализации параметров выявляют различные подмножества параметров, лежащие в основе разных задач для одного и того же факта.
Рассуждения цепочкой мыслей (chain-of-thought) черпают эффективность из вовлечения специфичных для задачи параметров, выходящих за рамки тех, что связаны с задачей оценки.

Эти выводы подрывают аналогию с "базой знаний", показывая, что то, что знает модель, и то, как она запрашивается, переплетены в пространстве параметров, что имеет последствия для надежности и управляемости фактических знаний в языковых моделях.