SciFactCheck оценивает 18 языковых моделей в пяти научных областях, и при этом выявляет, что научно настроенные модели демонстрируют снижение фактической надежности и уменьшение внутренней уверенности, несмотря на более языковую уверенность. Исследования с участием людей показывают ограниченное согласие между оценками инструментов проверки фактов и экспертными оценками, что подчеркивает трудности в определении действительных научных утверждений.
Научная тонкая настройка увеличивает фантастические суждения языковых моделей
Переведено с English → Русский