Los autores proponen ParametricSkills, un marco que convierte habilidades de texto libre en parámetros en el momento de la prueba mediante el entrenamiento de una hiperred para generar adaptadores LoRA. Este enfoque permite la explotación de habilidades sin contexto, abordando la dificultad de adherirse a las instrucciones en escenarios complejos.
- El método construye una biblioteca de habilidades a gran escala y sintetiza trayectorias de explotación de un solo turno y múltiples turnos utilizando OpenCode.
- Una hiperred recibe habilidades textuales para parametrizar tanto el contenido de la habilidad como la metodología de explotación como adaptadores LoRA.
- Los resultados experimentales en seis subtareas de ingeniería de software muestran una mejora promedio de 6.44 puntos sobre el aprendizaje in-context al ser evaluados por DeepSeek-V4-Flash.
- El marco logra puntuaciones BERT Score y F1 significativamente más altas en comparación con los métodos base.
Las habilidades paramétricas son inherentemente acumulativas, ofreciendo una vía prometedora hacia el aprendizaje continuo en el momento de la prueba para capacidades agénticas.