Tag: Knowledge Transfer
All the articles with the tag "Knowledge Transfer".
-
Recurrent Knowledge Identification and Fusion for Language Model Continual Learning
本文提出Recurrent-KIF框架,通过内外循环机制动态估计参数重要性并迭代融合新旧知识,在持续学习中有效缓解灾难性遗忘并促进知识转移,实验验证其在多个大语言模型上的性能优势。
-
Efficient Knowledge Transfer in Multi-Task Learning through Task-Adaptive Low-Rank Representation
本文提出 TA-LoRA 方法,通过任务自适应低秩表示和快速-缓慢权重机制提升多任务学习的知识转移效率,实现对未见任务的优异泛化性能,同时保持高参数效率。
-
ExpertSteer: Intervening in LLMs through Expert Knowledge
EXPERTSTEER提出了一种创新的激活转向方法,通过自编码器、互信息分析和递归特征机从外部专家模型生成转向向量,干预任意目标大型语言模型的行为,在多个领域和模型上显著提升性能。
-
Param$Δ$ for Direct Weight Mixing: Post-Train Large Language Model at Zero Cost
本文提出Param∆方法,通过直接添加参数差值在零成本下实现后训练知识向新基模型的转移,达到与传统后训练相当的性能。