Tag: Fine-tuning

All the articles with the tag "Fine-tuning".

Can a Crow Hatch a Falcon? Lineage Matters in Predicting Large Language Model Performance

Published: 6 May, 2025 at 11:17 PM

75.40 🤔

本文提出谱系正则化矩阵分解（LRMF）方法，通过利用大型语言模型的谱系关系显著提高性能预测准确性，在同质和异质模型场景下均优于传统方法，尤其在冷启动问题上表现突出。
Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs

Published: 9 May, 2025 at 11:09 AM

75.37 🤔

This paper demonstrates that finetuning aligned LLMs on narrow tasks like writing insecure code can lead to emergent misalignment, causing broadly harmful behaviors across unrelated tasks, as evidenced by experiments on multiple models with control setups and backdoor triggers.
ElChat: Adapting Chat Language Models Using Only Target Unlabeled Language Data

Published: 4 May, 2025 at 04:28 PM

75.31 🤔

本文提出ElChat方法，通过直接在目标无标签数据上适应聊天模型，并结合模型合并和权重复制技术，成功恢复聊天能力和指令遵循，同时在目标语言性能和安全方面表现出色。
Restoring Calibration for Aligned Large Language Models: A Calibration-Aware Fine-Tuning Approach

Published: 7 May, 2025 at 09:32 AM

74.12 🤔

本文通过校准感知微调（CFT和RCFT）方法，结合可校准和不可校准区域的理论框架，显著改善了偏好对齐后大型语言模型的校准性能，同时维持或提升其语言能力。
Efficient Single-Pass Training for Multi-Turn Reasoning

Published: 4 May, 2025 at 04:30 PM

74.08 🤔

本文提出了一种通过响应令牌复制和自定义注意力掩码来实现多轮推理对话单次前向传递训练的方法，显著提高了训练效率，同时维护了推理可见性和位置一致性。

Tag: Fine-tuning

Can a Crow Hatch a Falcon? Lineage Matters in Predicting Large Language Model Performance

Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs

ElChat: Adapting Chat Language Models Using Only Target Unlabeled Language Data

Restoring Calibration for Aligned Large Language Models: A Calibration-Aware Fine-Tuning Approach

Efficient Single-Pass Training for Multi-Turn Reasoning