Tag: Large Language Model

All the articles with the tag "Large Language Model".

ASIDE: Architectural Separation of Instructions and Data in Language Models

Published: 4 May, 2025 at 04:27 PM

53.34 🤔

本文提出ASIDE方法，通过在嵌入级别应用固定正交旋转实现大型语言模型的指令-数据架构分离，提高了模型的安全性和对提示注入攻击的鲁棒性，同时不牺牲性能。
Meeseeks: An Iterative Benchmark Evaluating LLMs Multi-Turn Instruction-Following Ability

Published: 4 May, 2025 at 04:31 PM

53.12 🤔

本文提出Meeseeks多轮指令遵循基准，通过迭代反馈机制系统评估LLMs的自纠错能力，发现模型在多轮互动中性能显著提升。
You Name It, I Run It: An LLM Agent to Execute Tests of Arbitrary Projects

Published: 4 May, 2025 at 04:26 PM

53.07 🤔

本文提出ExecutionAgent，一个基于LLM的自主代理，通过meta-prompting和迭代反馈机制自动设置并执行任意软件项目的测试套件，显著提高了测试执行的成功率和准确性。
LLM Enhancer: Merged Approach using Vector Embedding for Reducing Large Language Model Hallucinations with External Knowledge

Published: 4 May, 2025 at 04:31 PM

51.20 🤔

本文提出 LLM-ENHANCER 系统，通过合并多个在线数据来源并使用向量嵌入减少大型语言模型的幻觉，提高响应准确性，同时保持自然性和经济性。
Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning

Published: 4 May, 2025 at 04:29 PM

50.69 🤔

本文提出PaperCoder框架，通过多代理LLM的多阶段管道自动从机器学习论文生成高质量代码仓库，提升了研究的可复现性，并在基准测试中显著优于现有方法。

Tag: Large Language Model

ASIDE: Architectural Separation of Instructions and Data in Language Models

Meeseeks: An Iterative Benchmark Evaluating LLMs Multi-Turn Instruction-Following Ability

You Name It, I Run It: An LLM Agent to Execute Tests of Arbitrary Projects

LLM Enhancer: Merged Approach using Vector Embedding for Reducing Large Language Model Hallucinations with External Knowledge

Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning