作者提出了数据自适应低秩适应(Data-Adaptive Lower-Rank Adaptation, DALorRA),这是一种变分贝叶斯稀疏框架,旨在解决大型语言模型在特定任务微调过程中的过度自信问题。该方法将不确定性量化从密集参数空间转移到低秩适应(LoRA)的轻量级秩级别。通过对秩维度施加随机掩码,DALorRA在训练期间实现了模型容量的贝叶斯正则化,并在推理期间提供了类似集成的校准。
大量实验表明,DALorRA在不损害LLM推理准确性的情况下,实现了出色的校准效果。
作者提出了数据自适应低秩适应(Data-Adaptive Lower-Rank Adaptation, DALorRA),这是一种变分贝叶斯稀疏框架,旨在解决大型语言模型在特定任务微调过程中的过度自信问题。该方法将不确定性量化从密集参数空间转移到低秩适应(LoRA)的轻量级秩级别。通过对秩维度施加随机掩码,DALorRA在训练期间实现了模型容量的贝叶斯正则化,并在推理期间提供了类似集成的校准。
大量实验表明,DALorRA在不损害LLM推理准确性的情况下,实现了出色的校准效果。