世界上第一个成功的仅使用硅光子集成电路的神经网络计算
世界上第一个成功的仅使用硅光子集成电路的神经网络计算

2023/09/13
世界第一仅限硅光子集成电路神经网络运算成功 向实现低延迟、省电的AI计算电路迈出了一大步
人工智能 (AI) 系统现已成为各种情况下不可或缺的技术。神经网络是人工智能系统最基本的数学模型之一。使用数字处理器构建AI系统规模变得越来越大,导致处理延迟和功耗显着增加我愿意。为了解决这个问题,使用光代替电子的“光集成电路”正在引起人们的注意。然而“光集成电路”因其特性而无法处理传统的非线性函数到目前为止,仅使用光来执行神经网络计算一直很困难。解决它“能够进行非线性映射神经网络运算的硅光集成电路”世界上第一个成功的仅使用光学集成电路的神经网络操作做这件事的人是平台光子研究中心的孔安伟。 (2022/6/30 新闻稿) 使用低延迟和低功耗的光进行神经网络计算已经成为可能,这为“硅光子集成电路”作为光学人工智能计算集成电路的应用铺平了道路,以补充传统电子电路。
以速度为强项的光集成电路
人工智能现在对于高级信息处理来说是不可或缺的。 “神经网络”是信息处理最基本的数学模型之一,是模仿人脑神经回路的分层数学模型,具有输入层、隐藏层和输出层神经元相互连接的结构。
用图像等数据训练模型后,当将测试数据给予输入层时,在隐藏层根据学习结果通过计算(加权、变换等)在输出层得到答案。神经网络结构,例如隐藏层的深度(层数)和宽度(每层神经元数量)的设计方式多种多样,但近年来模型变得越来越大。
输入层、隐藏层、输出层的神经元相互连接,根据学习结果即可得到答案。
人工智能操作通常通过打开和关闭电子集成电路上的晶体管来执行。近年来,随着人工智能模型变得越来越大,打开和关闭所需的功率和处理时间也变得越来越大、越来越长。为了在各种情况下利用人工智能,处理延迟和功耗增加是主要问题。
在电子电路中,晶体管每次开启和关闭需要 1 纳秒(1 纳秒等于 10−9秒)。这可能会增加大量时间,导致在需要即时处理的情况下计算处理延迟。与电子集成电路相比,光通过光学集成电路的速度约为电子电路时间的1/1000。我们创建的硅光子集成电路神经网络只需传播光即可进行计算,因此需要 10 皮秒(1 皮秒为 10−12秒)的时间内完成,并且消耗的电量更少。”
使用光的集成电路最重要的特征是它们的速度。然而,由于光比电子更难控制,光集成电路的计算应用直到现在才取得进展。
硅光集成电路实现神经网络计算
难以精细控制的光集成电路。然而,今敏开始考虑尝试使用光集成电路进行神经网络计算。那是在 2017 年左右。
他的老板、Platform Photonics 研究中心首席研究员 Koji Yamada 回忆起他收到提案的那一刻。 “我研究硅光子集成电路很多年了,但我没有时间考虑如何使用它们或它们的应用。由于它们已经用于光通信,我想找到不同的应用。”
创造一种可以控制光并进行神经网络计算的集成电路的新挑战仍然很困难,在最初的两三年里,他只是试图找到自己的方法。直到2022年6月,方向逐渐缩小,事情步入正轨,我们才能够总结并公布结果。 (2022/6/30 新闻稿)
采用精致布线连接的硅光集成电路
在光集成电路上进行神经网络计算的一个主要障碍是光集成电路由于其特性而无法处理非线性函数。计算非线性函数对于神经网络计算等高级计算至关重要。传统上,设备是光和电子的混合体,使用电子电路执行高级计算并使用光传输其他信息。然而,这种方法还未能完全发挥出光集成电路的优势。
Kon开发的方法使得执行“非线性映射”成为可能,从而可以执行只能处理线性函数的传统光学集成电路无法完成的计算。
例如,如果要对如下图左侧所示的循环分布的两类数据进行分类,则无法直接使用线性函数进行分类,但如果进行“非线性映射到高维复数空间”等预处理,则可以使用线性函数进行分类。有一种计算方法,如果硅光集成电路能够进行非线性映射到高维复数空间,那么就可以进行更高级的计算。因此,我们在数据输入部分添加了“非线性映射到高维复数空间”的功能。
“非线性映射到高维复杂空间”的预处理图像,以便可以使用线性函数将数据划分为分类平面
使用非线性映射的分类操作的图像如上图所示。例如,要绘制一条将左图中的黑色圆圈和蓝色方块分开的线,其中数据以二维方式绘制在左侧,则需要计算复杂的非线性函数(例如椭圆),但一旦将数据非线性映射到高维复杂空间(如右图所示),则可以使用线性分离平面轻松将其分离。这使我们能够避免传统的非线性函数运算。
新开发的硅光子集成电路的结构如下图所示。在硅基板上配置有硅光波导、金属布线等。它集成了 40 Mach-Zehnder 干涉仪和光学相位器来控制光和执行计算。
硅光子集成电路详细结构。光从图的左侧输入,通过马赫-曾德干涉仪进行计算,并将结果输出到八个端口。
待分析的数据作为电信号发送到输入部分的马赫-曾德干涉仪,并在此处转换为光信号。此时,利用Kong发明的方法对高维复空间进行非线性映射。之后,光信号依次通过马赫-曾德干涉仪和光移相器,改变或分裂其路径(相当于算术运算)。
最后在输出端口检测计算结果。检测到的光的强度指示计算结果,神经网络计算完成。输出端口处的光信号被转换回电信号。虽然数据输入输出后涉及到电子电路,但计算部分仅通过光传播来完成。这导致延迟时间是电子电路的千分之一,功耗是电子电路的十分之几。
利用硅光子集成电路解决“虹膜分类问题”
我们使用人工智能分类的基本基准问题来验证所开发的“硅光子集成电路”上的神经网络计算是否成功。在本题中,我们将根据花瓣的大小对三种鸢尾花进行分类,并测量正确答案的百分比。
首先,利用训练数据调整光学神经网络计算模型。 Kon开发的方法中的“学习”意味着调整硅光子集成电路的状态,以便响应输入获得正确的输出。在本研究中,我们调整了输出端口,以便在八个输出端口中,每个输出端口都具有最大光功率,具体取决于输入数据中的虹膜类型。其结果是,学习后的正确答案率约为94%,并且当保持已训练的硅光子集成电路的状态不变时,使用未用于学习的测试数据进行分类,正确答案率约为97%。
虹膜分类运算结果。硅光子集成电路学习后的计算结果表明,输出端口的光功率分布根据三种虹膜的分类而变化。
重要的是,我们能够利用片上学习的方式直接训练硅光子集成电路。硅光子集成电路之前都是利用其他计算机学习到的参数进行调整。但是,在这种情况下,在模型学习阶段利用光来加速和节省功耗的优势“而且,一旦我们了解了问题并确定了硅光子集成电路的状态,我们只需让光穿过它就可以得到计算结果。与电子电路不同,不需要每次计算时都切换晶体管。执行,因此这也是快速且节能的,”Kon 在谈到这一结果的吸引力时说道。
克服光的弱点并利用其优点
“仅使用光的神经网络计算”备受关注。硅光子集成电路可以作为专门用于高速AI处理的运算电路已经很明显,但未来预计会有什么样的发展?
对于虹膜分类问题,我们发现硅光子集成电路可以获得与电子电路相同的正确答案率,尽管表示模型尺寸的参数数量比电子电路小约六分之一。我们正在开始验证,通过使用我们提出的方法,我们相信神经网络计算本身的规模可以减小。
光有其优点和缺点,众所周知,它无法取代所有电子电路。今敏的目标是探索它与电子电路结合时可以表现出什么样的力量。 “通过将其与电子电路结合并创建一个循环,RNN (循环神经网络)并希望能够识别时间顺序。这将启用语音识别。我还认为,如果它能够变得更加多层和高性能,这样它就可以承担当今计算机的一些功能,那就太好了。”
山田还表示,“光学电路不像电子电路那么小,而且不太擅长数字计算。然而,它们的传播速度是压倒性的,并且擅长AI等模拟计算。考虑到它们应用在不能容忍数据处理延迟的情况下,我认为它们适合自动驾驶。”他们两人都觉得这个结果极大地开启了光的可能性。
光被认为“速度快,但不如电有用”,但它似乎已经进入加速阶段,以充分利用其速度。
平台光子学
研究中心
硅光子学研究团队
高级首席研究员
丛光伟
丛光伟