В статье описывается проверка Claude Sonnet 5 с использованием Skeptical Agent от MarCognity-AI для выявления разрыва между текстовой уверенностью и фактической проверяемостью, называемого «эпистемическим разломом».

  • Процесс включал прохождение ответов, сгенерированных моделью, через Skeptical Agent.
  • Цель состояла в том, чтобы выявить утверждения, которые нельзя проследить до какого-либо источника, даже в технически правильных ответах.
  • Ресурсы MarCognity-AI доступны на GitHub и Zenodo.