Etiquetado de datos de entrenamiento para coincidencia de entidades usando modelos de lenguaje grandes
Este artículo investiga el uso de modelos de lenguaje grandes como modelos maestros en flujos de trabajo de destilación de conocimiento para etiquetar automáticamente datos de entrenamiento para modelos estudiantes más pequeños en tareas de coincidencia de entidades. El estudio evalúa varias estrategias de selección de pares, modelos maestros y estudiantes, y métodos de postprocesamiento en cinco conjuntos de referencia estándar.