CADRE: Adaptación estable y eficiente en parámetros de modelos de lenguaje y visión médica con olvido acotado y deriva de previos
Los autores presentan CADRE, un marco eficiente en parámetros para adaptar modelos de lenguaje y visión médicos mientras se previene el olvido catastrófico y la deriva de previos. El método combina adaptación de bajo rango con un término de consolidación elástica de peso elástico escalado automáticamente en línea para acotar la pérdida de competencia retenida. También emplea una penalización ancla-a-previo para restringir la deriva de incrustaciones desde el modelo preentrenado congelado. Dos garantías breves respecto a la masa de consolidación y la invariancia de escala abordan la fragilidad de orden encontrada en EWC estándar. El enfoque se evaluó en datos de cáncer de mama a través de modalidades de histopatología, ultrasonido y radiografía de tórax. Al entrenar aproximadamente el 0.23% de los parámetros, CADRE logró la tasa de olvido más baja entre los métodos de adaptación. Esto representó una reducción siete veces mayor en comparación con la línea base regularizada más fuerte, bajando de 0.075 a 0.011. El modelo también demostró transferencia hacia atrás positiva donde todas las líneas base mostraron resultados negativos.