POTracker optimiza LLMs para la generación de informes de cortes de energía conforme a estándares

Los modelos de lenguaje grandes recientes tienen dificultades con la generación de datos específicos del dominio debido a estrictos requisitos de formato y estructura. Para abordar la interoperabilidad de los informes de cortes de energía de servicios públicos en Estados Unidos, los investigadores proponen POTracker, un modelo optimizado para generar documentos de cumplimiento legibles por máquina. El equipo ajustó finamente Qwen2.5-7B-Instruct utilizando un objetivo novedoso llamado POTrackerLoss. Esta nueva función de pérdida tiene en cuenta tanto la similitud textual como la similitud de etiquetas estructurales entre las salidas generadas y los informes de referencia. La evaluación en un conjunto de datos de 1,000 informes demuestra que POTracker supera a cinco métodos de ajuste fino y un enfoque de conversión XML basado en reglas. El modelo mejora la precisión general hasta en un 51% y alcanza una precisión estructural del 86.47% para los informes generados. Además, un estudio humano que involucró a expertos del dominio asignó una puntuación promedio de calidad de 4.03 en una escala de 0-5 a las etiquetas generadas.