STAGE es una tubería que genera datos de entrenamiento de texto a JSON utilizando LLMs para sintetizar informes y esquemas JSON, validados contra las hojas de cálculo subyacentes. Las evaluaciones en STAGE-Eval muestran que mejora la coincidencia exacta de Qwen3-4B del 31.37% al 74.27% y la precisión de valores del 45.46% al 90.69%.
STAGE: Generación de datos fundamentada en la fuente para texto a JSON
Traducido del English → Español