Tag: Large Language Model

All the articles with the tag "Large Language Model".

From System 1 to System 2: A Survey of Reasoning Large Language Models

Published: 4 May, 2025 at 04:26 PM

75.04 🤔

本文综述了从基础LLMs向推理LLMs的演进，通过整合System 2技术提升AI的逐步推理能力，并在基准测试中展示了显著性能改进。
Learning to Plan Before Answering: Self-Teaching LLMs to Learn Abstract Plans for Problem Solving

Published: 4 May, 2025 at 04:33 PM

74.84 🤔

本文提出LEPA自训练算法，通过训练LLM生成预期计划作为抽象元知识来提升问题解决泛化能力，并在多个推理基准上显著优于现有方法。
Racing Thoughts: Explaining Contextualization Errors in Large Language Models

Published: 7 May, 2025 at 12:18 AM

74.82 🤔

本文提出‘LLM Race Conditions Hypothesis’解释大型语言模型的上下文化错误，通过机械可解释性技术验证了关键窗口和上下文化顺序对模型性能的影响，并探索了推理时干预措施来缓解问题。
I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

Published: 18 May, 2025 at 11:22 AM

74.26 🤔

本文通过潜在变量模型和可识别性分析，证明大型语言模型通过下一词预测学习的表示近似为潜在概念后验概率对数的线性变换，支持线性表示假设，并提出结构化稀疏自编码器改进概念提取效果。
Restoring Calibration for Aligned Large Language Models: A Calibration-Aware Fine-Tuning Approach

Published: 7 May, 2025 at 09:32 AM

74.12 🤔

本文通过校准感知微调（CFT和RCFT）方法，结合可校准和不可校准区域的理论框架，显著改善了偏好对齐后大型语言模型的校准性能，同时维持或提升其语言能力。

Tag: Large Language Model

From System 1 to System 2: A Survey of Reasoning Large Language Models

Learning to Plan Before Answering: Self-Teaching LLMs to Learn Abstract Plans for Problem Solving

Racing Thoughts: Explaining Contextualization Errors in Large Language Models

I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

Restoring Calibration for Aligned Large Language Models: A Calibration-Aware Fine-Tuning Approach