Tag: Efficiency

All the articles with the tag "Efficiency".

SELF: Self-Extend the Context Length With Logistic Growth Function

Published: 1 Jun, 2025 at 11:52 AM

86.07 🤔

本文提出SELF方法，通过逻辑增长函数动态调整token分组大小以扩展大型语言模型的上下文长度，在部分长上下文任务上相较Self-Extend提升了性能，但普适性和稳定性仍需验证。
Investigating Task Arithmetic for Zero-Shot Information Retrieval

Published: 7 May, 2025 at 08:43 AM

86.02 🤔

本文提出任务算术方法，通过参数加减操作实现零样本信息检索的领域和语言适应，在科学、生物医学和多语言数据集上取得最高18%的NDCG@10提升，展现了轻量级模型适应的潜力。
Thinker: Learning to Think Fast and Slow

Published: 31 May, 2025 at 11:16 AM

86.01 🤔

本文提出Thinker任务，通过将问答过程分解为快速思考、验证、慢速思考和总结四个阶段，利用强化学习针对性训练大型语言模型的直觉和推理能力，在数学推理基准上实现了显著性能提升。
Compression via Pre-trained Transformers: A Study on Byte-Level Multimodal Data

Published: 2 Jun, 2025 at 01:15 PM

86.00 🤔

本文通过大规模实验证明，预训练小型Transformer模型在考虑参数大小的情况下，能在文本、图像和音频的分布外数据上实现与传统压缩算法竞争的压缩比，尤其在训练模态内表现优异，但跨模态迁移能力较弱。
S-GRPO: Early Exit via Reinforcement Learning in Reasoning Models

Published: 20 May, 2025 at 11:10 AM

85.99 🤔

本文提出 S-GRPO 方法，通过串行组生成和递减奖励策略调控大型语言模型中间推理过程，在多个基准数据集上实现推理长度减少 35.4%~61.1% 和准确率提升 0.72%~6.08%，显著提升推理效率。

Tag: Efficiency

SELF: Self-Extend the Context Length With Logistic Growth Function

Investigating Task Arithmetic for Zero-Shot Information Retrieval

Thinker: Learning to Think Fast and Slow

Compression via Pre-trained Transformers: A Study on Byte-Level Multimodal Data

S-GRPO: Early Exit via Reinforcement Learning in Reasoning Models