Los investigadores proponen una tubería modular para construir un modelo de lenguaje grande de razonamiento en el dominio de viajes, fundamentado en un grafo de conocimiento diseñado por expertos, para abordar problemas de precisión y confiabilidad en dominios especializados. El enfoque integra un grafo de conocimiento de viajes, un procedimiento de construcción ascendente para pares de preguntas y respuestas de múltiples saltos, y ajuste fino supervisado para incrustar el conocimiento del dominio como trazas de razonamiento auditables.

  • La tubería utiliza un grafo de conocimiento de viajes que codifica entidades y relaciones del dominio para generar pares de preguntas y respuestas de múltiples saltos mediante un procedimiento de construcción ascendente.
  • Se aplica ajuste fino supervisado utilizando los pares de preguntas y respuestas generados como trazas de razonamiento auditables para mejorar las capacidades de razonamiento del modelo.
  • La evaluación de Qwen3-4B con adaptación LoRA logró una coincidencia exacta del 82,4% en un benchmark del dominio de viajes, superando significativamente la línea base preentrenada del 22,4%.
  • El análisis de calibración identificó dos modos de fallo: decodificación multietiqueta sobreconfiada y fallos de razonamiento donde el modelo no logra reconstruir rutas correctas de múltiples saltos a pesar de tener hechos de apoyo.

Este trabajo confirma que el razonamiento explícito fundamentado en grafos de conocimiento mejora sustancialmente la precisión y la interpretación de la incertidumbre en dominios especializados, aislando la calibración por opción y la decodificación consciente de la longitud de la traza como áreas clave para futuras mejoras.