Skip to content
Go back 2504.10498 arXiv logo

CCSK:Cognitive Convection of Self-Knowledge Based Retrieval Augmentation for Large Language Models

Published:  at  08:43 AM
70.69 🤔

本文提出CCSK框架,通过Siamese Network和Response Quality Model动态融合查询相似性和响应质量,优化大型语言模型的信息检索决策,在多个问答数据集上显著提升了F1分数和准确率。

Large Language Model, RAG, Reasoning, Multimodality, Efficiency

Jianling Lu, Mingqi Lv, Tieming Chen

Zhejiang University of Technology

Generated by grok-3

Background Problem

大型语言模型(LLMs)在问答任务中通过检索增强生成(RAG)引入外部知识显著提升了性能,但其核心挑战在于如何平衡模型内部自知识与外部信息检索(IR)之间的冲突。传统基于阈值的方法采用单一静态标准,在动态查询环境下往往导致IR决策与LLM响应不相关,尤其是在处理复杂查询时表现不佳。为解决这一问题,作者提出了认知自知识对流(CCSK)框架,旨在通过动态联合决策过程优化信息检索决策,提升模型在复杂场景下的适应性和准确性。

Method

Experiment

Further Thoughts

CCSK框架的双模块动态决策机制为解决LLM内部知识与外部检索冲突提供了一个有趣的视角,但其复杂性可能限制其在低资源环境中的应用。未来可以探索更轻量化的替代方案,例如使用更简单的相似性计算方法或预训练的小模型来降低计算开销。此外,CCSK的动态阈值调整依赖于数据集特性,这提示我们是否可以引入元学习(Meta-Learning)方法,让模型自适应地学习阈值调整策略,从而提升其泛化能力。另一个值得思考的方向是CCSK与多模态任务的结合,例如在视觉-语言问答中,如何动态平衡图像信息与文本检索的权重,可能是一个有前景的跨领域应用。结合其他研究(如RAG领域的最新进展),CCSK的框架或许可以通过引入上下文学习(In-Context Learning)进一步减少对历史数据的依赖,从而提升在新领域中的冷启动性能。



Previous Post
Test-time regression: a unifying framework for designing sequence models with associative memory
Next Post
MegaScale-Infer: Serving Mixture-of-Experts at Scale with Disaggregated Expert Parallelism