Skip to content
Go back 2503.02497 arXiv logo

PennyLang: Pioneering LLM-Based Quantum Code Generation with a Novel PennyLane-Centric Dataset

Published:  at  04:26 PM
55.37 🤔

本文提出 PennyLang 数据集和 RAG/GraphRAG 框架,通过提升 LLM 在 PennyLane 量子代码生成中的准确性和正确性,填补了 AI 辅助量子编程的空白。

Large Language Model, Code Generation, Retrieval-Augmented Generation, Quantum Computing, Data Curation, Graph Data

Abdul Basit, Nouhaila Innan, Haider Asif, Minghao Shao, Muhammad Kashif, Alberto Marchisio, Muhammad Shafique

New York University Abu Dhabi

Generated by grok-3-mini-latest

Background Problem

量子计算作为一项变革性技术,具有解决经典系统无法处理的复杂问题的潜力,但现有框架的专业性导致编程挑战,阻碍了其广泛采用。PennyLane 是一个领先的开源 Python 框架,专注于混合量子-经典计算,但与 Qiskit 框架相比,缺乏等效的 AI 驱动代码辅助工具。大型语言模型 (LLMs) 在经典编程中表现出色,能够提高开发效率并减少错误,但其在量子编程,尤其是 PennyLane 生态系统中的应用仍未得到充分探索。本文从解决 PennyLane 缺乏高质量数据集和 AI 辅助工具的空白入手,针对量子代码生成中的数据可用性和上下文关联问题,构建了一个专为 PennyLane 设计的指令-响应数据集,并开发了评估框架,以提升 LLM 在量子编程任务中的性能。

Method

Experiment

Further Thoughts

这项工作强调了高质量数据集在专业领域 AI 应用中的关键作用,未来可探索将 GraphRAG 扩展到其他量子框架如 Qiskit 或 Cirq,以实现跨框架代码生成;此外,结合量子机器学习中的噪声中间规模量子 (NISQ) 设备优化或与其他 AI 技术(如强化学习)整合,可能进一步提升模型鲁棒性和泛化能力,并为量子计算在实际应用中的部署提供更深层的洞见。



Previous Post
An Empirical Study of Evaluating Long-form Question Answering
Next Post
Learning Explainable Dense Reward Shapes via Bayesian Optimization