Исследование критериев приемлемости на основе LLM в немецком Центробанке

В данной статье представлен первый кейс применения больших языковых моделей к процессу немецкого Центробанка по проверке приемлемости ценных бумаг для обеспечения, с переходом от традиционного распознавания именованных сущностей к генеративному конвейеру извлечения информации. Подход разбивает задачу на извлечение, нормализацию и интерпретацию для более эффективной работы с зашумленным текстом и двуязычным контентом.

Система достигает высокой точности до 91% при проверке приемлемости на уровне документа.
Для семантической оценки используется методология LLM-as-a-judge, а не метрики, основанные на локализации.
Модель демонстрирует консервативный профиль работы, минимизируя ложное принятие неприемлемых активов.

Этот метод снижает ресурсоемкость ручной проверки объемных полуструктурированных проспектов эмиссии за счет преодоления ограничений, связанных с шумом OCR и лингвистическими вариациями.