Skip to content
Go back 2505.01842 arXiv logo

Exploring the Role of Diversity in Example Selection for In-Context Learning

Published:  at  09:33 AM
64.87 🤔

本文提出基于多样性的上下文学习(DICL)方法,通过最大边际相关性(MMR)算法重新排序示例以平衡相关性和多样性,在多个数据集和大型语言模型上实现了约70%的下游任务性能提升或维持。

In-Context Learning, Large Language Model, Representation Learning, Multimodal Data, Efficiency

Janak Kapuriya, Manit Kaushik, Debasis Ganguly, Sumit Bhatia

University of Galway, University of Glasgow, IIIT Delhi, Adobe Systems

Generated by grok-3

Background Problem

近年来,大型语言模型(LLM)通过上下文学习(ICL)展现了在少量标注示例下执行任务的强大能力。然而,传统的ICL方法主要依赖于基于稀疏或密集嵌入的相似性函数来选择与输入相关的示例,这种策略可能引入主题偏见,导致所选示例间缺乏多样性,从而影响下游任务的表现。本文旨在解决这一问题,提出通过提升所选示例的主题多样性来改善ICL的性能,特别是在检索任务中,探索多样性是否能为模型提供更丰富的上下文知识,进而提升预测准确性。

Method

本文提出了一种基于多样性的上下文学习(DICL)方法,核心在于平衡示例与输入的相关性及其多样性。具体步骤如下:

Experiment

实验在四个数据集(RTE、COLA、SST2、TREC)上进行,涵盖文本蕴含、语法可接受性、情感分类和开放域问题分类任务,使用了三种不同规模和架构的LLM(Phi2-2.7B、Mistral-7B、LLaMA3-8B)。实验设置包括零样本(Zero-Shot)、标准ICL(基于TF-IDF和SBERT相似性)以及DICL(TF-IDF-MMR和SBERT-MMR)。通过网格搜索调整参数 KK(示例数量)和 α\alpha(相关性与多样性权重),并在验证集上优化后在测试集上评估F1分数。结果显示:

Further Thoughts

尽管DICL提供了一个有趣的视角,即通过多样性提升ICL性能,但其实际应用价值仍需进一步探讨。例如,MMR算法在信息检索领域已被广泛研究,但在ICL场景下是否是最优的多样性策略尚不确定,是否可以引入更先进的聚类或生成式方法来动态构建多样性上下文?此外,论文未提及DICL在计算效率上的影响,尤其是在大规模数据集或实时应用中,MMR的迭代计算可能成为瓶颈,是否可以通过近似算法或预计算来优化?另一个值得思考的方向是多样性与任务类型的关联性,例如在需要高度专业知识的领域(如医学或法律)中,过分强调多样性是否可能引入噪声,反而降低性能?结合检索增强生成(RAG)任务(如作者未来计划),DICL是否能通过结合无标注上下文进一步提升性能,特别是在跨领域或多模态场景中?这些问题值得后续研究深入探索,同时也可以与其他领域的多样性研究(如推荐系统中的多样性优化)建立联系,以获得更广泛的理论支持。



Previous Post
HyPerAlign: Hypotheses-driven Personalized Alignment
Next Post
Kimi-Audio Technical Report