创新点:团队突破了深度神经网络学习和推理过程中需要使用高精度数据进行信息传输的限制,开发了基于存内计算的在线学习算法。通过使用随机二值化信号和开发对忆阻器突触阵列硬件友好的单次盲写操作,实现网络在线学习,并在保持图片识别准确率提升的前提下,降低了深度神经网络学习和推理的功耗。
关键词:深度神经网络,存内计算,在线训练,忆阻器,随机二值化信号,鹏城实验室
图1. 随机二值化深度网络的在线训练算法及其硬件实现。(a)信号正向传播过程中的随机二值化过程;(b)激活函数导数的随机二值化过程;(c)误差信息的符号进行反向传播;(d)通过噪声信号和比较器实现随机二值化信号的正向传播;(e)通过两次相互独立的采样过程和逻辑门运算实现激活函数导数的计算和随机二值化过程;(f)使用晶体管和比较器实现误差符号信息的反向传播。
通过存内计算范式,使用模拟忆阻器作为权重器件,可以在深度学习中对神经网络系统进行并行操作,有效加速大量高精度的向量矩阵乘加运算。通过基尔霍夫定律和欧姆定律,忆阻器十字交叉阵列可以一步完成各神经网络层中信号正向和反向传输过程中的向量矩阵乘加运算。在运算过程中,电压作为输入信号,忆阻器十字交叉阵列的电导值作为权重,输出信号为电流。但是,在忆阻器阵列中完成向量矩阵乘加运算,需要对输入电压进行准确的调制,并对输出的电流信号进行准确的读取,而这依赖于高精度的数模转换器和模数转换器。而由高精度转换器带来的功耗增加和电路面积开销增大,一定程度上抵消了模拟并行计算带来的增益。此外,虽然系统可以并行地处理每层神经网络中的梯度计算和权重更新,但由于忆阻器的波动性,对系统来说准确并渐变地调整忆阻器电导值依然非常具有挑战性。在一个独立的非冯·诺依曼架构中,实现有效的在线存内学习依然是一项艰巨的任务。另外,生物系统使用电压脉冲,即有或无的动作电位,来进行信息传递,在数学上可以被看成是二值化信号,这就使得高精度信号的使用在生物学上不能解释。最后,基于忆阻器的硬件系统使用模拟和具有噪声的人工权重器件来表示突触权重信息,这在系统中就引入了本征的噪声。目前的硬件系统还没有完全利用这一噪声来进一步简化硬件设计。
针对上述问题,团队提出了基于正向传播信息随机二值化、激活函数随机二值化和反向传播误差符号化的在线神经网络训练算法。基于随机二值化信号,团队对神经网络的基本运算过程进行了调整,将高精度计算转变为简单的逻辑门运算,降低了信号处理的计算需求,并且更加适配以忆阻器作为权重器件的硬件电路。同时,团队还开发了对忆阻器突触阵列友好的单次写操作权重调整方式来适配在线训练算法,与基于“读-验证”多次读写的权重调整方式相比,新的权重更新模式简化了忆阻器读写电路系统的复杂度并降低了电路功耗。在团队自主开发的基于忆阻器的神经网络训练和推理仿真平台中,模拟结果显示新算法在降低神经网络训练和推理的计算量和功耗的同时,获得了更高的图片识别准确度。与使用传统高精度算法和多次读写忆阻器权重更新硬件操作模式相比,新算法实现了两个数量级的能耗降低;与使用传统高精度算法和互补金属-氧化物-半导体(CMOS)权重硬件相比,新算法实现了三个数量级的能耗降低。同时,基于随机二值化信号和忆阻器突触阵列的神经网络硬件与生物神经网络更加相似,并且硬件神经网络的在线训练不再依赖于忆阻器的理想突触调节特性。该研究还对神经网络激活函数的生物学本质进行了探讨。本工作展现出新算法在性能上的优势,并为新算法和基于忆阻器的存内计算在大模型中的应用提供了初步探索和理论支持。
鹏城实验室战略与交叉前沿部微电子前沿基础研究室在基于忆阻器的存内计算、类脑计算技术基本算法和系统架构方面开展系统性研究,为未来人工智能芯片的开发提供技术储备。同时,研究室还聚焦于新型微电子、光电子器件的TCAD仿真工具,器件紧凑模型以及数据驱动的参数提取方法等前沿基础研究。李阳助理研究员为本文第一作者,王伟副研究员为本文的唯一通信作者。
该项目获得了鹏城实验室前沿项目和重大项目支持,鹏城实验室网络智能部、电路与系统部以及中科院微电子所、复旦大学、意大利米兰理工大学等国内外多家单位参与上述研究。
WILEY
论文信息:
Binary-stochasticity-enabled highly efficient neuromorphic deep learning achieves better-than-software accuracy
Yang Li, Wei Wang*, Ming Wang, Chunmeng Dou, Zhengyu Ma, Huihui Zhou, Peng Zhang, Nicola Lepri, Xumeng Zhang, Qing Luo, Xiaoxin Xu, Guanhua Yang, Feng Zhang, Ling Li, Daniele Ielmini, Ming Liu
Advanced Intelligent Systems
DOI: 10.1002/aisy.202300399
点击左下角 “ 阅读原文 ” ,查看该论文原文。
Advanced
Intelligent
Systems
期刊简介
Wiley旗下智能系统领域开放获取旗舰刊。期刊收录关于具有刺激或指令响应智能的人造装置系统的研究,包括机器人、自动化、人工智能、机器学习、人机交互、智能传感和程序化自组装等前沿应用。Advanced Intelligent Systems 最新的期刊引文指标1.05,期刊影响因子7.4,在计算机科学和人工智能中分类皆为Q1。(源自Clarivate 2022)
AdvancedScienceNews
Wiley旗下科研资讯官方微信平台
长按二维码 关注我们
分享前沿资讯|聚焦科研动态
发表科研新闻或申请信息分享,请联系:ASNChina@Wiley.com
AdvancedScienceNews
Wiley旗下科研资讯官方微信平台
长按二维码 关注我们
分享前沿资讯|聚焦科研动态
发表科研新闻或申请信息分享,请联系:ASNChina@Wiley.com