当前位置: 首页 > news >正文

量子计算+AI:特征选择与神经网络优化创新应用

在由玻色量子协办的第二届APMCM“五岳杯”量子计算挑战赛中,来自北京理工大学的Q-Masterminds团队摘取了银奖。该团队由北京理工大学张玉利教授指导,依托玻色量子550计算量子比特的相干光量子计算机,将量子计算技术集成到特征选择和神经网络剪枝中,在提升人工智能领域的两大经典问题:特征选择和图像分类的模型性能和效率上体现了巨大的潜力,为解决复杂人工智能问题提供了新的方向

对于特征选择问题,团队提出了一种基于集成特征选择与参数优化(IFSPO)框架的量子SVM(支持向量机)分类器。数值实验表明,在相干光量子计算机上使用量子计算方法,与经典SVM方法相比,量子SVM的准确率提升了2.70%,精度提升了10.57%,有效提升了求解效率。

对于图像分类问题,团队提出了一种新的量子神经元剪枝与重训练模型(QNPR),通过联合优化神经元剪枝和网络训练,在保持模型性能的同时提高效率。

头图
基于相干光量子计算机(CIM)的数值实验表明,与仅剪枝优化(PO)模型相比,QNPR模型减少了约30%的神经元数量,同时提高了准确性并保持了强大的预测能力。 随着人工智能技术的快速发展,神经网络模型在各个领域都取得了显著的成果。然而,随着模型复杂度的增加,模型的参数规模也呈指数级增长,这给模型的训练和应用带来了巨大的挑战。

特征选择在人工智能领域尤其是在处理高维数据时至关重要,识别最相关的特征可以提高模型性能、降低复杂性并减少过度拟合。传统的两阶段优化范式容易导致次优解的产生,因此团队提出了一种新颖的分类模型,利用量子计算在训练过程中共同优化特征选择和模型参数,在加速求解的同时并提高处理大规模数据的效率。

在图像分类领域,传统的神经网络模型压缩技术主要包括模型剪枝、量化、低秩分解等,这些方法虽然能够在一定程度上压缩模型,但仍然存在一些局限性。团队提出的量子神经元剪枝方法,通过利用量子计算的并行处理能力和高效优化特性,能够对大规模模型进行更精确、更高效的压缩,可以在不损失甚至达到比原始网络更高的精度的情况下实现高参数压缩比。

该团队的研究并不仅是简单地将量子计算作为加速工具,而是从算法层面重新思考了机器学习的基础架构,选择特征选择和神经网络优化这两个反映人工智能系统核心挑战的关键问题作为突破口,将量子计算集成到特征选择和神经网络剪枝中,通过构建量子-经典混合的解决方案,在提升性能和效率上体现了巨大潜力,为克服"维度灾难"这一长期困扰AI发展的瓶颈问题提供了切实可行的路径。

以下为获奖论文的主要内容:

量子SVM分类器:集成特征选择和参数优化

传统机器学习中的特征选择方法长期面临一个根本性矛盾:严格的特征筛选可能导致信息损失,而保留过多特征又会引入噪声并增加计算负担,团队通过量子-经典混合优化框架,使用量子计算机来解决集成特征选择和参数优化问题,实现了对这一矛盾的创造性解决。

团队提出了一种在集成特征选择和参数优化(IFSPO)框架下的量子SVM分类器,与传统的两阶段优化范式不同,传统方式先进行特征选择,再训练分类模型,这种分离式的优化可能导致次优解。而IFSPO框架有效地利用了训练过程中的所有候选特征来生成预测,从而最大限度地减少特征选择错误,获得更好的泛化和更稳健的模型。

考虑到经典SVM在处理非线性可分数据时的局限性,团队引入了 “软间隔” 概念和代理损失函数对模型进行改进,构建出集成特征选择和参数优化(IFSPO)模型。在将IFSPO模型转化为可由量子计算机高效求解的QUBO模型过程中,针对传统方法中处理约束条件时易引入过多辅助变量的问题,团队提出离散化方法和不平衡惩罚方法,仅使用n个二进制变量对2^n个离散值进行编码,避免了使用辅助变量来获取线性不等式约束的惩罚项,有效控制了QUBO问题的规模。

在数值验证阶段,团队选用人工智能领域的知名数据集-德国信用评分数据集验证性能,下表比较了量子SVM和经典SVM之间的性能指标,以及相应的百分比改进。结果表明,Quantum SVM在精度和准确度方面优于经典SVM。具体来说,Quantum SVM的准确率提高了2.70%,精度提高了10.57%,表明在提高预测性能方面的潜力,特别是在精度方面,Quantum SVM可以更好地处理不平衡的数据集。

量子SVM和经典SVM的性能指标比较

量子SVM和经典SVM的性能指标比较

同时团队还使用了Kaiwu SDK中的量子模拟退火算法来求解QUBO模型。如图描述了哈密顿量随时间推移的演变:随着时间的推移,哈密顿值逐渐减小,并且随着泵浦光功率的逐渐增加而发生相变,最终达到振荡阈值。当系统达到最低能量状态时获得的解表示最优解,相应的时间表示计算时间,量子模拟退火算法只需3.5秒即可实现高效的求解。

求解QSVMFSPO的哈密顿量演变

求解QSVMFSPO的哈密顿量演变

用于分类任务的量子神经元剪枝与重训练模型(QNPR)

深度学习技术尤其是图像分类方面近年来取得了重大进展,然而随着神经网络规模的不断增长,深度神经网络(DNN)通常包含大量参数,导致计算成本和存储要求急剧增加,从而也可能导致过度拟合,影响模型的泛化能力。神经元剪枝是一种常用的解决方法,然而现有的研究多存在可能导致次优结果以及错误修剪具有不可替代特征信息的重要结构等局限性。基于此,Q-Masterminds团队提出一种基于量子计算的神经网络剪枝和参数训练的集成优化方法,联合优化神经元剪枝和网络训练任务,利用量子计算更准确地识别和删除冗余神经元,提高神经网络的计算效率,在保持模型精度的同时满足大规模网络和复杂任务的需求。

剪枝-训练集成优化模型

剪枝-训练集成优化模型

具体来说,团队提出神经网络剪枝-训练集成模型(QNPR),将网络训练、网络剪枝、网络量化三个任务集成优化,通过求解模型可得到全局最优的网络参数以及剪枝方案。为了利用量子计算机的高性能计算优势,团队将集成训练模型转化为QUBO模型,提出紧凑的惩罚项构造方法,无需使用额外的辅助变量即可构造出ReLU约束的惩罚项,有效缩减问题规模,并使用相干光量子计算机高效求解QUBO模型。

在数值验证阶段,团队使用相干光量子计算机分别求解了以下三种模型:(1)提出的量子神经元剪枝与重训练模型(QNPR)(2)仅剪枝优化模型(PO)(3)传统基于激活模式和相似性的方法(APOZ),并绘制相应的哈密顿能量收敛曲线。数值实验表明,与传统方法相比,QNPR模型直接将剪枝策略整合到训练过程中,优化神经网络结构并提高计算效率;与仅剪枝优化(PO)模型以及基于激活模式和相似性的方法相比,QNPR模型在减少网络复杂度的同时,能够实现更好的性能。结果表明,QNPR模型相比PO模型减少了大约30%的神经元数量,同时提高了准确性,并保持了较强的预测能力

仿真数据集与集成模型效果验证

仿真数据集与集成模型效果验证

在与商业求解器Gurobi的对比实验中,相干光量子计算机的求解速度也远优于Gurobi。

相干光量子计算机真机与商业求解器Gurobi计算时间对比

相干光量子计算机真机与商业求解器Gurobi计算时间对比

Q-Masterminds团队提出的这两种基于量子计算的神经网络模型压缩算法,并通过实验验证了它们的有效性和优越性,为神经网络模型压缩领域提供了新的思路和方法,更展示了一种可扩展的量子-经典协同计算范式。

此次APMCM“五岳杯”量子计算挑战赛,众多优秀参赛团队依托玻色量子550量子比特相干光量子计算机,成功完成了AI、金融、生物制药等众多行业真实场景的技术突破与应用升级。未来,玻色量子将联合中国信息通信研究院、移动云、中国人工智能学会等举办更多的量子计算挑战赛,大力培养更多的量子实用化优秀人才,欢迎点击下方小程序访问玻色量子开发者社区,获取更多量子计算学习资源与活动资讯!

点击此链接进入玻色量子开发者社区

关于第二届APMCM“五岳杯”量子计算挑战赛

第二届APMCM“五岳杯”量子计算挑战赛 是由中国信息通信研究院、中国移动云能力中心、北京图象图形学学会主办,北京玻色量子科技有限公司协办,国内最具影响力的量子计算创新赛事。旨在让高校学生体验真实量子算力,探索创新项目,建立实用化量子计算基础研究,加强培养量子计算人才队伍,持续完善“量子计算+”产学研用生态建设。自第二届大赛启动以来,共有近2000支队伍,近5000人报名竞赛,玻色量子研发的Kaiwu SDK调用量达数百万次。通过本次竞赛,玻色量子联合移动云与中山大学、哈尔滨工业大学、中南大学、北京理工大学等众多国内知名高校达成深度合作,共同赋能量子应用创新,共同建设数字中国量子生态体系。

http://www.xdnf.cn/news/885367.html

相关文章:

  • 【汇编逆向系列】六、函数调用包含多个参数之多个整型-参数压栈顺序,rcx,rdx,r8,r9寄存器
  • 三表查询SQL怎么写?----小白初学+案例引入
  • 【Linux网络篇】:从HTTP到HTTPS协议---加密原理升级与安全机制的全面解析
  • 【Go语言基础】基本语法
  • python摆放花盆 2023年信息素养大赛复赛/决赛真题 小学组/初中组 python编程挑战赛 真题详细解析
  • 【JavaEE】万字详解HTTP协议
  • LangChain 入门指南:基于 DeepSeek 模型构建对话流程(保姆级)
  • 今日科技热点速览
  • 【联网玩具】EN 18031欧盟网络安全认证
  • 数论~~~
  • 曼昆《经济学原理》(第9版)微观经济学第二章第一节作为科学家的经济学家
  • 西门子SCL之IF-ELSIF语句详解及应用(安全控制代码)
  • RDMA简介5之RoCE v2队列
  • 如何做好一份技术文档?(下篇)
  • Windows系统下Cursor与QWQ-32B大模型的本地部署及插件调用实现方法
  • OpenAI 即将推出 GPT-5:开启多模态、持续记忆对话新时代
  • MATLAB读取文件内容:Excel、CSV和TXT文件解析
  • 【C#】异步和多线程
  • 优化09-表连接
  • 各种排序算法的再整理
  • 【Nginx】使用 Nginx+Lua 实现基于 IP 的访问频率限制
  • 命令行运行python程序报错 ImportError: /lib/x86_64-linux-gnu/libstdc++.so.6
  • Cursor AI编程助手模型选择对了吗?
  • mysql跨库关联查询及视图创建
  • 机器学习——什么时候使用决策树
  • PostgreSQL 入门教程
  • 边缘计算应用实践心得
  • 防反接电路设计浅谈
  • 在使用一些不用驱动大电流的设备就可以用stm32的自己的上下拉但是本身上下拉不就是给iicspi这些他通信给信号的吗中怎么还跟驱动能力扯上了有什么场景嘛
  • Wireshark使用教程(含安装包和安装教程)