DALorRA应用贝叶斯稀疏LoRA以改进LLM的不确定性估计

作者提出了数据自适应低秩适应（Data-Adaptive Lower-Rank Adaptation, DALorRA），这是一种变分贝叶斯稀疏框架，旨在解决大型语言模型在特定任务微调过程中的过度自信问题。该方法将不确定性量化从密集参数空间转移到低秩适应（LoRA）的轻量级秩级别。通过对秩维度施加随机掩码，DALorRA在训练期间实现了模型容量的贝叶斯正则化，并在推理期间提供了类似集成的校准。

大量实验表明，DALorRA在不损害LLM推理准确性的情况下，实现了出色的校准效果。