mile米乐官方网站利用自旋电子学开发人工神经元并成功进行语音识别

-利用自旋转矩振荡元件实现神经形态计算-

积分

使用纳米级自旋扭矩振荡元件设计人工神经元
使用振荡元件识别语音，正确率达 996%
预计应用于人工智能

摘要

米乐m6官方网站[理事长中钵良二]（以下简称“AIST”）自旋电子学研究中心[研究中心主任汤浅真司]金属自旋电子学团队研究员常木住人、研究组组长药师寺敬、研究中心久保田仁志总研究主任、福岛研究中心副主任昭夫等人与法国巴黎萨克雷大学、美国国家标准研究所（NIST）合作，美国。自旋扭矩振荡器 (STO)神经元并论证了其原理。

模仿人脑神经元和突触的信息处理神经拟态计算预计能够高速、低功耗地处理大量模糊和不完整的信息，例如大脑擅长的识别和学习。这次，我们开发了一种使用纳米级自旋扭矩振荡元件作为人工神经元的神经形态电路语音识别系统。这是世界上第一个使用纳米级人工神经元的语音识别系统，该系统能够以996%的准确率识别人类说出的“0”到“9”单词。这是一个更大、更复杂的光学系统水库计算机新开发的人工神经元有望加速神经形态计算和人工智能等领域的研究和开发。

　该结果详情于7月27日（当地时间）发表在英国学术期刊上自然

使用自旋力矩振荡器的人工神经元电路图（左）和语音识别的成功率（右）

发展的社会背景

　近年来，“TrueNorth”等人工智能芯片的研究积极开展。这些芯片具有模仿人脑信息处理的神经形态系统。该系统由神经元组成，被认为负责大脑中的信息传输和记忆功能。突触通过人工元素，我们的目标是进一步了解大脑，使语音识别和模式识别更高效、更快速。这些使用传统计算机的处理存在效率低下的问题，消耗的能量是人脑的一万倍以上，并且需要更大的运算电路。为了解决这个问题，有多种神经元芯片的研发正在进行中。高效、超小型的人工神经元和突触对于模仿人脑的神经形态系统的发展至关重要。

研究历史

　AIST利用在非易失性磁存储器STT-MRAM的开发中积累的薄膜材料技术和微元件制造技术，对自旋扭矩振荡装置的实际应用进行研究。自旋转矩振荡元件是一种具有高非线性的超小型振荡元件。此外，如果元件尺寸减小到约10纳米，则可以在约1微瓦的微小输入信号下工作，从而形成低功耗和高效率的振荡元件。 AIST在自旋转矩振荡装置的研发方面取得了世界领先的成果。 (2008 年 8 月 28 日、2014 年 1 月 8 日、2015 年 12 月 14 日、 AIST 2016 年 12 月 16 日新闻稿）

研究内容

自旋扭矩振荡元件是一种自激振荡元件，当施加直流电时，通过激发自旋共振进动（铁磁共振）来产生交流电压（图1（a））。由于该振荡元件的输出电压取决于直流电流的大小，因此可以通过改变直流电流值来改变输出交流电压值(图1(b))。此时，交流电压的幅值不再跟随输入瞬时变化，而是放松时间的时间延迟而逐渐变化。另外，交流电压的幅值与电流值不成正比，非线性表现得像10954_11004|神经形态系统需要弛豫时间和非线性的这种特性短期记忆和信号的非线性。

图1 自旋扭矩振荡器示意图(a)和交流电压相对于直流电流的时间变化(b)

(a) 箭头表示磁化方向。 (b)输出交流电压(包络线)的大小根据流过自旋转矩振荡元件的直流电流的大小而非线性变化。此外，输出交流电压的包络随着输入直流电流的突然变化而变化，并具有弛豫时间。

　使用这种人工神经元，我们利用储存计算机的概念构建了一个神经形态系统。使用这个系统，我们进行了一项实验来识别人类所说的数字“0”到“9”（英语）。图 2(a) 显示“1”音频信号。音频信号经过预处理（滤波和掩蔽）成为输入信号（图 2(b)）。当该信号输入到由自旋扭矩振荡器组成的人工神经元电路时，获得如图2(c)所示的输出电压。图7中的波形之间发生变化。图2(b)和图2(b)由于自旋转矩振荡元件的弛豫时间和非线性，如图2(c)所示。

　用于学习和识别的语音数据是来自 5 个说话者的 0 到 9 10 个数字的数据集。我们准备了10个不同话语的数据集，用N个数据集进行学习，用(10-N)次进行识别。图2(d)显示了语音识别的成功率对学习次数的依赖关系。这里，“无振荡元件”是指直接输入信号（图2（b））语音识别程序处理时，“具有振荡元件”表示用相同的语音识别程序处理人工神经元的输出信号(图2(c))的情况。通过使用由振荡器元件组成的人工神经元电路，即使学习周期数很少，语音识别的成功率也得到了显着提高。正确答案率高达 996%，尽管使用了纳米尺寸的人工神经元，但他们仍达到了与更大、更复杂的光储计算机相同的答案率。

图2 话语“1”的音频信号（英语）（a），对音频信号进行预处理的自旋扭矩振荡器的输入信号（b），自旋扭矩振荡器的输出信号（c），语音识别成功率对话语数量的依赖性（d）
（au是用于表示数量比率的相对物理单位（任意单位）。）

未来计划

　我们的目标是开发一种先进的神经形态系统，将新的人工突触连接到新开发的人工神经元，并实现大数据的实时信息处理。

术语解释

◆自旋扭矩振荡器（STO）: 当直流电通过纳米级磁阻元件时，电子的磁性（自旋）会导致元件中所含铁磁材料中的自旋引起共振进动（称为铁磁谐振），从而在元件两端产生交流电压。与半导体元件不同，自旋扭矩振荡元件可以直接产生微波波段的交流信号，而不需要使用谐振器或用于提高频率的电路。又称STO，英文“Spin-Torque Oscillator”的缩写。[返回来源]
◆神经元: 它通过神经网络传输信息并在传统计算机中进行算术处理。通常，它会生成高度非线性信号，例如脉冲。[返回来源]
◆神经形态计算: 模仿人脑神经网络的计算机。该计算机通常由充当信息传输起点的神经元以及连接每个神经元的突触组成。也称为神经网络。它可以用比传统计算机更低的功耗解决识别问题。[返回来源]
◆水库电脑: 一种神经网络。在一般的神经网络中，进行突触调整（学习）来提高问题的回答率。此外，当解决涉及大量数据的复杂问题时，例如图像识别，需要使用多层神经网络，并且突触的数量变得巨大。创建一种方法来调整每一层的大量突触给电路设计带来了沉重的负担。另一方面，储存器计算机不训练输出层以外的突触，而仅训练最后阶段的突触。这使得电路非常容易控制。此外，由于它包括随机神经元之间的连接，因此不需要对电路进行复杂的控制，这在电路设计中是一个主要优点。一个典型的例子是使用激光等光学振荡器的光学储库计算机。[返回来源]
◆突触: 神经网络连接每个神经元并确定一个神经元对下一个神经元的影响。目前正在积极研究的机器学习是指调整神经形态计算机中的突触。[返回来源]
◆神经元芯片: 一种使用人工创建的神经元和突触来模仿人脑神经回路的芯片。[返回来源]
◆放松时间: 从一种状态转换到另一种状态所需的时间。[返回来源]
◆非线性: 无法用线性方程表达的属性，例如比例关系。[返回来源]
◆短期记忆: 记忆保留的时间相对较短。由于信息不是永久的，因此信息会随着时间的推移而消失。[返回来源]
◆语音识别程序: 这里的语音识别程序是指将“1”到“9”的语音分类为“1”到“9”类别的程序。具体而言，通过输入图1所示的时序信号数据，参照图2(b)和2(c)，它计算所学习的信号序列“1”至“9”中哪一个最接近。[返回来源]

联系我们

查询表

mile米乐官方网站 利用自旋电子学开发人工神经元并成功进行语音识别

积分

摘要