В данной статье представлен первый кейс применения больших языковых моделей к процессу немецкого Центробанка по проверке приемлемости ценных бумаг для обеспечения, с переходом от традиционного распознавания именованных сущностей к генеративному конвейеру извлечения информации. Подход разбивает задачу на извлечение, нормализацию и интерпретацию для более эффективной работы с зашумленным текстом и двуязычным контентом.

  • Система достигает высокой точности до 91% при проверке приемлемости на уровне документа.
  • Для семантической оценки используется методология LLM-as-a-judge, а не метрики, основанные на локализации.
  • Модель демонстрирует консервативный профиль работы, минимизируя ложное принятие неприемлемых активов.

Этот метод снижает ресурсоемкость ручной проверки объемных полуструктурированных проспектов эмиссии за счет преодоления ограничений, связанных с шумом OCR и лингвистическими вариациями.