Tag: Large Language Model

All the articles with the tag "Large Language Model".

Cross-Lingual Optimization for Language Transfer in Large Language Models

Published: 26 May, 2025 at 11:23 AM

85.77 🤔

本文提出跨语言优化（CLO）方法，通过翻译数据和改进的DPO策略，将英语中心的大型语言模型有效转移到目标语言，在保持英语能力的同时显著提升目标语言性能，尤其在低资源语言中以更少数据取得优于传统SFT的结果。
Interleaved Reasoning for Large Language Models via Reinforcement Learning

Published: 31 May, 2025 at 11:21 AM

85.73 🤔

本文提出了一种交错推理范式，通过强化学习训练大型语言模型交替思考和回答，显著降低时间到首token（TTFT）超过80%，并在多个推理任务上提升准确率最高达19.3%。
Structured Agent Distillation for Large Language Model

Published: 28 May, 2025 at 11:23 AM

85.73 🤔

本文提出结构化代理蒸馏框架，通过分割大型语言模型代理轨迹为推理和行动片段并施加分段特定监督，在压缩模型时显著提升任务成功率、推理效率和一致性，优于token级基线。
Achieving Tokenizer Flexibility in Language Models through Heuristic Adaptation and Supertoken Learning

Published: 23 May, 2025 at 11:14 AM

85.73 🤔

本文提出TokenAdapt框架，通过混合启发式初始化策略实现分词器移植，并在零样本困惑度测试中显著优于基线方法，同时初步探索Supertoken学习以提升压缩效率。
SSR: Speculative Parallel Scaling Reasoning in Test-time

Published: 23 May, 2025 at 11:09 AM

85.72 🤔

本文提出SSR框架，通过选择性并行模块和步骤级推测性解码，在测试时显著提升大型语言模型在数学推理任务中的效率-准确性权衡，无需额外训练。

Tag: Large Language Model

Cross-Lingual Optimization for Language Transfer in Large Language Models

Interleaved Reasoning for Large Language Models via Reinforcement Learning

Structured Agent Distillation for Large Language Model

Achieving Tokenizer Flexibility in Language Models through Heuristic Adaptation and Supertoken Learning

SSR: Speculative Parallel Scaling Reasoning in Test-time