إطار عمل بياني بدون تدريب يستنتج ترتيب القراءة في تخطيطات الوثائق المعقدة

تم اقتراح إطار عمل قائم على الرسوم البيانية وبدون تدريب لاستنتاج ترتيب القراءة في المخطوطات التاريخية المعقدة، مثل تخطيط Glossa Ordinaria حيث تتشابك تدفقات النص مكانيًا. تبني الطريقة رسمًا انتقاليًا موجهًا للترشيحات من خطوط OCR وتستعيد الترتيب العالمي باستخدام قاعدة استنتاج ندم أقصى لتجنب فشل الاختيار الجشع.

تُقيَّم الحواف بمجموعة مرجحة للاحتمالية الشرطية لنموذج اللغة السببي وتنبؤ الجملة التالية (NSP) الخاص بـ BERT.
على تخطيطات Glossa Ordinaria الاصطناعية، تستعيد الطريقة متوسط 95% من حواف الخلف الصحيحة مقارنة بـ 50% لـ XY-cut المتكرر.
على مجموعة فرعية متعددة الأعمدة مكونة من 140 صفحة من OmniDocBench، تحقق دقة حافة كلية تبلغ 88% مقابل 75% لـ XY-cut و25% لـ LayoutReader.
يُظهر النهج ثباتًا مرآويًا، حيث يتغير بأقل من نقطة مئوية واحدة تحت انعكاسات الصفحة، بينما يتغير LayoutReader-T حتى 8 نقاط.

يعالج هذا الإطار عنق الزجاجة المتمثل في رقمنة التخطيطات المعقدة حيث تعاني الطرق القياسية مثل XY-cut من فشل متسلسل وتنقل أساسيات LayoutReader بشكل سيء بسبب عدم تطابق الحبيبات.