Skip to content
Go back 2503.01713 arXiv logo

SAGE: A Framework of Precise Retrieval for RAG

Published:  at  04:27 PM
64.13 🤔

本文提出SAGE框架,通过语义分割、基于梯度的块选择和LLM自反馈机制,提高RAG系统的检索精度和问答性能,同时显著降低成本。

Retrieval-Augmented Generation, Semantic Segmentation, Chunk Selection, Large Language Model, Cost Efficiency, Question Answering

Jintao Zhang, Guoliang Li, Jinyang Su

Tsinghua University

Generated by grok-3-mini-latest

Background Problem

检索增强生成(RAG)技术在特定语料库上的问答(QA)任务中表现出色,但仍存在许多失败案例,这些失败主要源于检索阶段的局限性而非大型语言模型(LLM)的不足。具体问题包括:(1)当前RAG方法在分割语料时未考虑语义,导致块之间相关性受损,难以检索到与问题相关的完整上下文;(2)在检索块数量上存在权衡:检索较少块可能遗漏关键上下文,而检索较多块则可能引入无关噪声,难以动态平衡。

Method

Experiment

Further Thoughts

SAGE框架的语义分割和动态块选择机制可能扩展到多模态检索领域,如结合[26]和[64]的工作,提升跨模态一致性;此外,自反馈机制可与LLM fine-tuning整合,参考[2]和[65],潜在降低成本并提升泛化能力;未来可探索更灵活的块选择策略,如直接训练LLM进行选择,或应用于多跳检索[21],以处理复杂查询场景。



Previous Post
Waking Up an AI: A Quantitative Framework for Prompt-Induced Phase Transition in Large Language Models
Next Post
SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation