Credence: семантические метрики и анализ сходимости для разбиения утверждений

Credence вводит Semantic-F1, метрику косинусной схожести на основе BGE-large, которая повышает точность разбиения утверждений по сравнению с Jaccard на 15-32 процентных пункта. В работе доказаны теоремы сходимости для восстановления по правилам и на основе LLM: восстановление по правилам является конечным и монотонным, в то время как восстановление на основе LLM требует механизмов раннего выхода. Оценки в социальных медиа, энциклопедических и новостных областях показывают EPR от 0,94 до 1,00, при этом восстановление по правилам снижает нарушения атомарности на 47-100% без потери точности.