≡ AI工具

SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法

分类:AI工具
SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法

SaRA是什么

SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基于核范数低秩稀疏训练方案避免过拟合,引入渐进式参数调整策略,优化模型性能。SaRA能提高模型的适应性和泛化能力,显著降低计算成本,只要修改一行代码即可实现,具有很高的实用价值。

SaRA