Tag: Fine-tuning

All the articles with the tag "Fine-tuning".

LoRA-One: One-Step Full Gradient Could Suffice for Fine-Tuning Large Language Models, Provably and Efficiently

Published: 2 Jun, 2025 at 01:14 PM

86.16 🤔

本文通过理论分析揭示LoRA适配器与一步全微调梯度子空间的对齐特性，提出LoRA-One算法，利用谱初始化策略显著提升大型语言模型在自然语言理解、数学推理和代码生成任务上的微调性能，同时保持计算效率。
EfficientQAT: Efficient Quantization-Aware Training for Large Language Models

Published: 24 May, 2025 at 11:15 AM

86.14 🤔

EfficientQAT提出了一种高效的量化感知训练框架，通过块级全参数训练（Block-AP）和端到端量化参数训练（E2E-QP），在低比特场景下显著提升大型语言模型的量化性能，同时大幅降低训练资源需求。
Dynamic Fisher-weighted Model Merging via Bayesian Optimization

Published: 6 May, 2025 at 01:19 AM

86.13 🤔

本文提出了动态 Fisher 加权合并 (DF-Merge) 方法，通过贝叶斯优化动态调整微调模型的缩放系数，并在这些缩放模型上利用 Fisher 信息进行加权合并，从而高效地创建性能显著优于现有基线的多任务模型。
Graceful Forgetting in Generative Language Models

Published: 31 May, 2025 at 11:20 AM

86.10 🤔

本文提出Learning With Forgetting (LWF)框架，通过自生成知识、Fisher信息矩阵加权的遗忘置信度计算和周期性遗忘策略，在生成式语言模型的微调中实现优雅遗忘，实验表明其在大多数领域特定问答任务上显著提升性能。
SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models

Published: 31 May, 2025 at 11:34 AM

85.98 🤔

本文提出SORSA，一种基于奇异值分解和正交正则化的参数高效微调方法，通过优化权重矩阵条件数提升大型语言模型在下游任务上的性能，并在GSM-8K等基准测试中显著优于LoRA和PiSSA等方法。

Tag: Fine-tuning

LoRA-One: One-Step Full Gradient Could Suffice for Fine-Tuning Large Language Models, Provably and Efficiently

EfficientQAT: Efficient Quantization-Aware Training for Large Language Models

Dynamic Fisher-weighted Model Merging via Bayesian Optimization

Graceful Forgetting in Generative Language Models

SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models