Skip to content
Go back 2504.20946 arXiv logo

Trace-of-Thought Prompting: Investigating Prompt-Based Knowledge Distillation Through Question Decomposition

Published:  at  01:18 AM
93.53 😐

本文提出了 Trace-of-Thought Prompting,一种基于提示的知识蒸馏框架,通过将复杂问题分解为可管理的步骤,有效地将高资源模型的推理能力迁移到低资源模型,显著提升了低资源模型在算术推理任务上的表现,且无需大量微调。

Knowledge Distillation, In-Context Learning, Prompt Engineering, Reasoning, Problem Decomposition, Human-AI Interaction

Tyler McDonald, Ali Emami

Brock University

Generated by gemini-2.5-flash-preview-04-17

Background Problem

传统的知识蒸馏方法对于大型语言模型(LLMs)通常需要大量的计算资源进行微调,这限制了其可访问性。同时,现有的提示工程方法(如 Chain-of-Thought)在应用于较小的、低资源的开源模型时往往效果不佳。 因此,需要一种无需大量微调、更易于访问和扩展的知识蒸馏方法,能够有效地将高资源模型的复杂推理能力迁移到低资源模型,并利用提示工程的优势。

Method

Experiment

Further Thoughts

这项工作通过提示工程实现了知识蒸馏,为低资源模型赋能提供了一个无需大量计算资源(如微调)的新思路。这与传统的基于 logits 或特征匹配的蒸馏方法形成对比。 Trace-of-Thought 的核心在于将复杂任务分解,这与人类解决复杂问题的方式类似,也与一些多智能体协作或规划类的工作(如 Tree-of-Thoughts, Plan-and-Solve)有共通之处。 未来的研究可以探索如何自动化教师模型的步骤生成过程,使其更鲁棒,减少教师错误传播。此外,这种基于步骤的蒸馏是否适用于更抽象或需要创造性推理的任务(如论文限制中提到的抽象推理)值得进一步探索。将这种方法与少量微调结合,或者让低资源模型在蒸馏过程中具备一定的自我纠错能力,可能会进一步提升效果。 这项工作也暗示了,即使是能力相对较弱的模型,如果能被引导遵循一个清晰的推理路径,也能显著提升性能。



Previous Post
Survey of Abstract Meaning Representation: Then, Now, Future
Next Post
A Survey on Test-Time Scaling in Large Language Models: What, How, Where, and How Well?