Se presenta un nuevo conjunto de datos con 173 y 106 clases de signos, que permite un OCR cuneiforme de extremo a extremo. Un modelo basado en DETR logra una mejora del 28-37% sobre trabajos previos en métricas estilo COCO, detectando casi 2,9 millones de signos en 87.668 fragmentos de tablillas del corpus eBL.
Conjunto de datos y pipeline de OCR para la detección de signos cuneiformes a gran escala
Traducido del English → Español