摘要
光子人工智能芯片以光速执行运算,且具有低功耗、延迟低、抗电磁干扰的优势。小型化与集成化是实现这一技术革新的关键步骤。本文将光刻技术运用于衍射光栅的制作,提出一种基于10.6微米激光的全光衍射深度学习神经网络光栅设计及实现方法。由于光源波长由毫米波向微米波进化,神经元的特征尺度缩小至20微米,与现有光衍射神经网络相比,深度学习神经网络特征尺寸缩小了80倍,为进一步实现光子计算芯片大规模集成奠定了基础。
随着时代的发展,更加高速、携带信息更多的计算技术是当今科技工作者关注的热点问
目前,光子计算的研究已经取得了系列进展:金贤敏团
要进一步将光栅机器学习神经网络计算芯片推向应用,小型化与集成化是这一技术革新的关键步骤。受限于3D打印的精度,Lin等提出的0.75 mm波段全光衍射光栅尺度为8 cm×8 cm,神经元尺寸为数十微米,离大规模集成尚有距离。紫外光刻技
在训练人工神经网络模型时,数据被馈送到输入层并通过前向传播步骤计算输出,然后通过反向传播过程优化参数。根据Rayleigh-Sommerfeld原
, | (1) |
其中l代表第l层光栅神经网络,i为坐标位置 (xi,yi,zi) 的第i个神经元,λ为入射波长,且
,且, | (2) |
因此,l层光栅的第i个神经元的输出光可表达为
, | (3) |
其中,第l层的第i个神经元处的输入为前一层的所有输出项叠加,如
, | (4) |

图1 全光接连神经网络结构示意图
Fig.1 Schematic diagram of the structure of all-optical depth neural network
对于纯相位衍射深度神经网络光栅来说,忽略光在传播过程中的损失,将幅度因子设为理想值1.
为简化前向模型的架构,式(3)可以简写为
. | (5) |
如
. | (6) |
对于一个具有N层结构的光栅神经网络来说,输出光场的光强可以表示为
. | (7) |
将光栅神经网络的输出结果与输入进行比较,并将误差反向传递以迭代优化光栅参数,根据目标特性定义损失函数来评估衍射神经网络的输出,并采用随机梯度下降优化算法迭代优化光栅的相位参数,定义损失函数为输出平面光强和目标之间的误差均方差
, | (8) |
K表示输出平面的测量点数,光栅相位优化算法可表示为
. | (9) |
误差函数对相位因子求偏导计算相对误差梯度,表达式
, | (10) |
其中,为输出层复数光场的梯度,为前一层光栅网络神经元的相位因子,对于任意一层神经网络,复数光场的梯度可按如下公式计算
, | (11) |
其中,3≤L≤N-1。每一次误差背向传输迭代,都将一批训练过的数据反馈到衍射神经网络进行每一层的相位梯度计算,并根据计算结果更新优化衍射神经网络系统的相位分布。为将光栅网络训练成数字分类器,采用了

图2 MNIST手写数字数据库(部分输入层)
Fig.2 MNIST handwritten digital database (partial input layer)
将光栅神经网络的间距设置为1 mm,将MNIST的55 000对数据分成550批,每次训练使用一批,共训练两次,得到5层光栅神经网络的相位分布分别如

图3 训练的光栅神经网络相位分布
Fig.3 Trained grating neural network phase distribution
根据
, | (12) |
其中,nm为材料的折射率,na为空气折射率,ф为训练的光栅相位,λ为入射光源的波长,可计算出光栅的深度Δh。选取的光源为10.6 μm的二氧化碳激光器,光栅的刻写材料为锗,10.6 μm下锗的折射率为4.00
光栅相位(rad) | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 2π |
---|---|---|---|---|---|---|---|---|
光栅深度(μm) | 0 | 0.563 | 1.125 | 1.688 | 2.250 | 2.815 | 3.378 | 3.54 |
由

图4 光刻及套刻示意图
Fig.4 Photolithography and engraving
按照

图5 单片光栅的五次套刻掩膜版
Fig.5 Five times engraved mask for monolithic grating
采用原子力显微镜(Bruker, Dimension Icon)对五次套刻的光栅神经元进行成像,其平面及高度分布分别如

图6 衍射光栅神经元
Fig.6 Diffraction grating neurons
如

图7 深度学习光栅神经网络测试示意图
Fig.7 Schematic diagram of deep learning grating neural network

图8 (a)数字分类光栅神经网络输出结果,(b) 数字分类器正确率
Fig.8 (a) Digital classification grating neural network output results,(b) Digital classifier recognition accuracy
如

图9 引入加工误差后的光栅神经网络识别准确率
Fig.9 Accuracy of grating neural network recognition after introducing errors
结果表明,引入加工误差后,数字0,1,4,6,8的识别率下降、数字2,9的识别率增加、数字3,7的识别率持平。对4和8的识别率影响最大,准确率下降了6%,其余数字影响均在3%以内,且整体识别率趋势不受光栅高度误差影响,说明光栅神经网络整体容错性能较好。目前的全连接光栅神经网络训练模型中尚未引入非线性计算,提取数字特征的能力尚有提升空间,对于具有相似特征的数字识别率较低,例如将8识别为3和5的概率均为5%,而将9识别为7的概率高达10%,因此10个手写数字中,对8和9的识别率均低于80%。

图10 引入误差前、后识别准确率比较
Fig.10 Comparison of recognition accuracy before and after the introduction of error
基于全光衍射光栅机器学习神经网络在人工智能领域具有广阔的应用前景。本文通过前向传输步骤计算网络输出、反向传播过程优化参数训练了10.6微米全光衍射光栅深度神经网络数字分类器,正确率达到75%~97%。采用紫外光刻技术对设计的衍射光栅进行了5次套刻、套刻精度为110.62 nm,首次实现了特征尺寸为5 μm量级的全光机器学习神经元制作。在后续工作中将进一步优化光栅训练算法提高识别正确率,并对光栅刻写误差对神经网络的影响进行量化分析及改进,为进一步实现光子计算芯片大规模集成奠定基础。
References
Hermans M , Burm M , Van Vaerenbergh T , et al. Trainable hardware for dynamical computing using error backpropagation through physical media[J]. Nature Communications, 2015, 6:6729. [百度学术]
Sicre R, Jurie F. Discriminative part model for visual recognition ☆[J]. Computer Vision & Image Understanding, 2015, 141(C):28-37. [百度学术]
Husko C , Vo T D , Corcoran B , et al. Ultracompact all-optical XOR logic in a slow-light silicon photonic crystal waveguide[J]. Optics Express, 2011, 19(21):20681-90. [百度学术]
Tang H , Lin X F , Feng Z , et al. Experimental two-dimensional quantum walk on a photonic chip[J]. Science Advances, 2018, 4(5):eaat3174. [百度学术]
Xiaogang Q , Xiaoqi Z , Jianwei W , et al. Large-scale silicon quantum photonics implementing arbitrary two-qubit processing[J]. Nature Photonics, 2018. [百度学术]
Shen Y , Harris N C , Skirlo S , et al. [IEEE 2017 IEEE Photonics Society Summer Topical Meeting Series (SUM) - San Juan, PR, USA (2017.7.10-2017.7.12] 2017 IEEE Photonics Society Summer Topical Meeting Series (SUM) - Deep learning with coherent nanophotonic circuits[C]2017 IEEE Photonics Society Summer Topical Meeting Series (SUM). IEEE, 2017:189-190. [百度学术]
Xing L , Yair R , Yardimci N T , et al. All-optical machine learning using diffractive deep neural networks[J]. Science, 2018:eaat8084. [百度学术]
Lecun Y, Bengio Y, Hinton G. Deep learning.[J]. Nature, 2015, 521(7553):436. [百度学术]
Guo C, Jin L I, Shang X B, et al. Novel microwave/millimeter-wave passive waveguide devices based on 3-D printing techniques[J]. J. Infrared Millim. [百度学术]
Waves, 郭诚, 李津, 尚小邦,等. 基于3-D打印技术的新型微波/毫米波无源波导器件. 红外与毫米波学报).2017, 36(1):81-91. [百度学术]
Cao Y Y, Zhang Y G, Yao-Yao L I, et al. Fabrication of column shape two dimensional photonic crystals:double developments in holographic lithography process[J]. J. Infrared Millim. [百度学术]
Waves, 曹远迎, 张永刚, 李耀耀,等. 全息光刻和二次显影法制备柱形二维光子晶体. 红外与毫米波学报)2014, 33(1):45-49. [百度学术]
Bolk J, Ambrosius H, Stabile R, et al. Deep UV Lithography Process in Generic InP Integration for Arrayed Waveguide Gratings[J]. IEEE Photonics Technology Letters, 2018, PP(99:1-1. [百度学术]
JIA Jia. Improving the aspect ratio of ion beam etched trenches in HgCdTe, [J]. J. Infrared Millim. Waves, (离子束刻蚀碲镉汞的沟槽深宽比改进. 红外与毫米波学报)2015, 34(3):282-285. [百度学术]
Shen F, Wang A. Fast-Fourier-transform based numerical integration method for the Rayleigh-Sommerfeld diffraction formula.[J]. Appl Opt, 2006, 45(6):1102-1110. [百度学术]
Sheppard C J, Lin J, Kou S S. Rayleigh-Sommerfeld diffraction formula in k space.[J]. Journal of the Optical Society of America A Optics Image Science & Vision, 2013, 30(6):1180-1183. [百度学术]
He J, Chen L, Wang Q. Measurements of Infrared Materials Refractiveindex Using Infrared Interferometer, [J]. Acta Photonica Cinica(贺俊, 陈磊, 王青. 使用红外干涉仪测量红外材料折射率. 光子学报), 2010, 39(6):1125-1128. [百度学术]