Tag: Large Language Model
All the articles with the tag "Large Language Model".
-
Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models
本文通过MathIF基准测试评估大型推理模型在数学任务中的指令遵循能力,揭示了推理能力提升与指令遵循能力下降之间的权衡关系,并通过实验验证了训练策略和推理链长度对这一权衡的影响。
-
ShareLoRA: Parameter Efficient and Robust Large Language Model Fine-tuning via Shared Low-Rank Adaptation
ShareLoRA通过在模型层间共享低秩矩阵A或B,显著减少可训练参数量(相较LoRA减少44%-96%),并在多种模型和任务中保持甚至超越LoRA的性能,展现出高效性、适应性和跨域鲁棒性。
-
Steering LLM Reasoning Through Bias-Only Adaptation
本文通过训练转向向量(steering vectors)验证了大型语言模型中推理能力已潜藏的假设,在数学推理任务上以极高的参数效率接近甚至超过全模型微调的表现。
-
When Thinking Fails: The Pitfalls of Reasoning for Instruction-Following in LLMs
本文通过对15个大型语言模型在指令遵循任务上的评估,揭示了链式思维(CoT)提示会导致性能下降的现象,并通过约束注意力分析和四种缓解策略(尤其是分类器选择性推理)有效恢复了部分性能。
-
First Finish Search: Efficient Test-Time Scaling in Large Language Models
本文提出First Finish Search (FFS),一种无需训练的测试时扩展策略,通过并行解码并选择最先完成的推理轨迹,在推理任务上显著提升大型语言模型准确率(如DeepSeek-R1在AIME数据集达82.23%),同时减少高达45%的令牌使用量。