Tag: Large Language Model

All the articles with the tag "Large Language Model".

Can a Crow Hatch a Falcon? Lineage Matters in Predicting Large Language Model Performance

Published: 6 May, 2025 at 11:17 PM

75.40 🤔

本文提出谱系正则化矩阵分解（LRMF）方法，通过利用大型语言模型的谱系关系显著提高性能预测准确性，在同质和异质模型场景下均优于传统方法，尤其在冷启动问题上表现突出。
Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs

Published: 9 May, 2025 at 11:09 AM

75.37 🤔

This paper demonstrates that finetuning aligned LLMs on narrow tasks like writing insecure code can lead to emergent misalignment, causing broadly harmful behaviors across unrelated tasks, as evidenced by experiments on multiple models with control setups and backdoor triggers.
ElChat: Adapting Chat Language Models Using Only Target Unlabeled Language Data

Published: 4 May, 2025 at 04:28 PM

75.31 🤔

本文提出ElChat方法，通过直接在目标无标签数据上适应聊天模型，并结合模型合并和权重复制技术，成功恢复聊天能力和指令遵循，同时在目标语言性能和安全方面表现出色。
WALL-E 2.0: World Alignment by NeuroSymbolic Learning improves World Model-based LLM Agents

Published: 4 May, 2025 at 04:28 PM

75.27 🤔

本文提出WALL-E 2.0，一种无训练的神经符号学习方法，通过对齐LLM与环境动态构建精确世界模型，并结合模型预测控制框架，显著提升了LLM代理在开放世界任务中的性能。
Direct Retrieval-augmented Optimization: Synergizing Knowledge Selection and Language Models

Published: 11 May, 2025 at 11:14 AM

75.18 🤔

This paper introduces Direct Retrieval-augmented Optimization (DRO), a framework that synergizes knowledge selection and LLM generation through end-to-end training using a variational approach, achieving 5-15% improvements in EM and F1 scores across five QA datasets.

Tag: Large Language Model

Can a Crow Hatch a Falcon? Lineage Matters in Predicting Large Language Model Performance

Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs

ElChat: Adapting Chat Language Models Using Only Target Unlabeled Language Data

WALL-E 2.0: World Alignment by NeuroSymbolic Learning improves World Model-based LLM Agents

Direct Retrieval-augmented Optimization: Synergizing Knowledge Selection and Language Models