Tag: Multi-Agent

All the articles with the tag "Multi-Agent".

CoordField: Coordination Field for Agentic UAV Task Allocation In Low-altitude Urban Scenarios

Published: 8 May, 2025 at 12:16 AM

90.99 🤔

本文提出了一种基于协调场的代理系统（CoordField），通过大型语言模型解析自然语言指令并利用动态势场实现异构无人机群在城市环境中的去中心化任务分配，实验验证了其在任务覆盖、响应时间和动态适应性方面的优越性能。
MergeBench: A Benchmark for Merging Domain-Specialized LLMs

Published: 20 May, 2025 at 11:23 AM

90.41 🤔

本文提出MergeBench，一个针对领域专精大型语言模型合并的全面基准测试框架，基于Llama和Gemma模型（2B-9B）评估八种合并方法，揭示了合并在大模型上的优越性、稀疏化和系数调整对知识保留的重要性，并提供了算法选择的实用指南。
Agentic AI: The Era of Semantic Decoding

Published: 8 May, 2025 at 12:27 AM

89.68 🤔

本文提出语义解码视角，将大型语言模型、人类和工具的协作框架化为语义空间中的优化过程，通过语义令牌的交换和语义解码算法的设计探索AI系统的新计算范式。
Memento No More: Coaching AI Agents to Master Multiple Tasks via Hints Internalization

Published: 5 Jun, 2025 at 11:25 AM

89.45 🤔

本文提出了一种通过迭代训练和人类反馈将提示内部化到模型权重中的方法，使基于Llama-3.1-70B的AI代理在多任务基准测试ToolQA和OfficeBench上分别达到97.9%和90.3%的成功率，超越GPT-4o和DeepSeek-V3，同时显著提升推理效率。
When Reasoning Beats Scale: A 1.5B Reasoning Model Outranks 13B LLMs as Discriminator

Published: 8 May, 2025 at 06:13 PM

88.68 🤔

This paper demonstrates that a 1.5B parameter reasoning model (Distill-R1) outperforms larger non-reasoning LLMs as a discriminator in a text-to-SQL planning framework by leveraging a novel soft score extraction method from chain-of-thought outputs, though it struggles significantly as a generator.

Tag: Multi-Agent

CoordField: Coordination Field for Agentic UAV Task Allocation In Low-altitude Urban Scenarios

MergeBench: A Benchmark for Merging Domain-Specialized LLMs

Agentic AI: The Era of Semantic Decoding

Memento No More: Coaching AI Agents to Master Multiple Tasks via Hints Internalization

When Reasoning Beats Scale: A 1.5B Reasoning Model Outranks 13B LLMs as Discriminator