体系的な評価により、LLMはすべてのサイズでデータ参照エラーを引き起こすことが示された

新しい研究は、構造の理解にもかかわらず表の値を誤って引用したり省略したりするテーブルデータ参照エラー（DREs）の最初の系統的評価を示している。この調査では、1.7Bから20Bのパラメータを持つすべてのテスト済みモデルでこれらのエラーが発生することがわかった。

著者たちは、専用批判者モデルを使用することで、これらの特定の参照失敗を識別し、より大きなモデルの推論を効果的に支援できることを実証している。