通知

通知文章2017/02/20

在东京工业大学设立“AIST-Tokyo Tech真实世界大数据利用开放创新实验室”(RWBC-OIL)
-利用现实世界的大数据利用技术实现新的价值创造-

米乐m6官方网站[会长:中钵良二](以下简称“AIST”)于2017年2月20日成立“AIST-东京工业大学现实世界大数据计算开放创新实验室;RWBC-OIL”东京工业大学与国立大学法人东京工业大学[校长三岛义直](以下简称“东京工业大学”)合作,在东京工业大学大冈山校区成立。产业技术研究院开放创新实验室 (OIL)RWBC-OIL是AIST第4次中长期计划(FY2015-FY2031)中提倡的“桥梁建设”的新型研究组织,RWBC-OIL是第六个此类研究组织。

在现实世界中,测量和积累了大量不同类型的数据(非结构化数据),例如文本文档和图像文件,这些数据无法轻松转换为数据库。为了利用这些大数据来解决现实世界中的问题,需要构建一个计算平台,可以在适当的位置组合多台计算机,以高效地处理大量异构数据。此外,还需要数据分析技术通过在计算平台上处理大量异构数据来获取知识。通过快速准确地分析此类现实世界的大数据,不仅可以提高运营效率并做出适当的态势判断,还可以创造出前所未有的新产品和服务。

AIST 在高性能计算研究方面拥有顶级技术,可最大限度地发挥计算机的能力并高速处理大量数据。作为非结构化数据的分析技术,我们正在研究和开发概率建模,整合服务和日常生活中产生的各种类型的大数据,并以5W1H等结构化方式表达现象背后的关系,使预测和模拟现象成为可能。此外,为了解决随着数据维度的增加,偶然检测的数量增加,真正的发现变得更加困难的问题,我们正在研究和开发一种独特的算法,通过从数据中删除不经常出现的组合并比较预测值,计算出明显更准确的预测值。

东京工业大学开发了构建大型超级计算机的技术,以世界顶级超级计算机 TSUBAME 系列为代表,作为计算平台构建技术。燕肯德基我们还提供在大型超级计算机上提供高性能的大数据处理技术,以及高速、资源节约型技术。深度学习技术及其在应用领域的应用技术,以及适合分析现实世界规模的社会经济现象(如交通量、股票价格)的大规模智能体模拟技术。

AIST 和东京工业大学现将在东京工业大学大冈山校区建立新的 AIST 基地 (RWBC-OIL),结合 AIST 和东京工业大学的计算平台建设技术和大数据处理技术。我们将通过构建开放平台,提供可应用于各个领域的大数据处理和分析技术,进行研究和开发,创造新的价值。此外,RWBC-OIL将与私营公司密切合作,促进联合研究和技术转让,旨在迅速将所取得的成果产业化并社会化。

AIST/东京技术开放创新实验室利用真实世界大数据的插图
图 AIST/东京科技现实世界大数据利用开放创新实验室 (RWBC-OIL)

RWBC-OIL 进行的主要研究

研究课题1 大数据处理开放平台的建立

我们将研发最大限度地利用大规模超级计算机技术的大数据处理平台。我们目前正在开发世界上性能最高的人工智能平台,将大规模数据处理技术应用于读取DNA碱基序列的基因组测序仪的数据,处理显示社交网络关系的大规模图形数据,以及图像识别(一种在传统超级计算机中尚未得到太多应用的数据)。AI 桥接云 (ABCI)以及世界顶级的大型超级计算机燕30/25我们将进行实施研究,构建一个可以应用于各种应用的开放平台。此外,通过该平台的运营,我们将考虑利用大数据的生态系统和开放平台的性质,并通过向数据中心运营商转让技术来实现行业应用。

研究课题2 利用大数据的数据处理技术的开发

深度学习处理平台将用于分析通过嵌入社会的各种高精度传感器(行车记录仪、监控摄像头、飞机和人造卫星)获得的异构和大量数据,从而节省劳动力并创建新的社会服务。

我们还旨在将随机建模技术与大规模智能体仿真技术相结合,将该技术应用于例如工业领域的装配工作流程优化和大型结构诊断、政策领域的区域发展决策支持以及服务领域的老年人健康趋势和未来预测等。

此外,我们将开发通用工具和库,为医疗保健、基因组分析和 IT 药物发现等领域的数据实现并自动执行独特的算法,这些领域有许多表征数据的元素,但数据量不足。我们将其实现为一个可以在 ABCI 和 TSUBAME 30 上高效执行并行计算处理的系统,并使用大规模实际数据对其进行评估。


开幕式

2017 年 2 月 20 日星期一,我们在东京工业大学大冈山校区举行了“AIST-Tokyo Tech 现实世界大数据利用开放创新实验室”(RWBC-OIL) 的开幕仪式。

中钵校长致辞并说明成立目的后,东京工业大学校长三岛芳直致欢迎辞,经济产业省、文部科学省、科学技术革新会议等嘉宾均致贺词,随后三岛校长与中钵校长举行了签字仪式。

仪式的后半场,被任命为实验室副主任的AIST研究组组长小川弘隆解释了RWBC-OIL的研究方向,然后听取了业界对实验室的期望的演讲。

开幕式非常成功,众多利益相关者和学生出席,足见对实验室的高度期望。

签约仪式合影
签约仪式
  纪念照片
纪念照

术语解释

◆开放创新实验室(OIL)
该项目是经济产业省于 2016 年启动的“开放创新竞技场”项目的一部分。AIST 在拥有优秀基础研究基础上的技术种子的大学和其他机构设立研究基地,通过这些大学和 AIST 之间进行深入、系统的研究,目的是加速技术的实际应用和“桥梁建设”,并加强旨在引导“桥梁建设”的基础研究。迄今为止,2016年4月,与名古屋大学合作成立了产研院/名古屋大学氮化物半导体先进器件开放创新实验室(GaN-OIL),2016年6月成立了产研院/东京大学先进操作数测量技术开放创新实验室(OPERANDO-OIL),同月,与东北大学合作成立了产研院/东北大学开放创新实验室。我们于2016年7月与早稻田大学合作成立了“数学先进材料建模开放创新实验室”(MathAM-OIL)、“AIST-早稻田大学生物系统大数据分析开放创新实验室”(CBBD-OIL),并于2017年1月与大阪大学合作成立了“AIST-大阪大学先进光子学和生物传感开放创新实验室”(PhotoBIO-OIL)。[返回来源]
◆深度学习技术
一种利用超大规模层次结构自动学习数据规律和模式的技术,使得对未知数据进行预测和分类成为可能。从数据中学习模式的技术通常称为机器学习,存在多种方法,但深度学习的独特之处在于它通过分层表示模式来学习。目前,深度学习技术通常用来指模仿人脑神经回路的更大规模(更深层次)的机器学习方法,称为人工神经网络,以及使用它们的通用识别和分析技术。它自2010年左右开始应用于音频和图像处理领域,并因表现出远远超过传统方法的性能而受到关注,并且已经在各个领域投入实际应用。这需要大规模的计算资源,并且由于近年来计算机技术的进步才成为可能。[返回来源]
◆AI桥接云(ABCI)
用于人工智能处理的大规模、节能的云基础设施(AI Bridging Cloud Infrastructure,它是一个用于人工智能的云,提供世界最高水平的机器学习处理性能,计划于 2017 年底投入运行,作为产学合作的计算基础设施。[返回来源]
◆燕30/25/肯德基
这是一组代表日本的大型集群超级计算机,由东京工业大学安装的 GPU 加速。 TSUBAME20于2010年投入运行,2013年升级至25,性能单精度171 petaflops,双精度57 petaflops,处于世界顶尖水平。 TSUBAME-KFC是作为TSUBAME30的原型开发的,旨在探索超级计算机的终极功率​​和冷却​​效率,并在2013年和2014年在展示功率效率和全球排名的Green500中获得世界第一,通过使用油浸冷却和各种功率控制技术。它还针对机器学习和大数据进行了升级,拥有单机架15 petaflops的性能。 TSUBAME30计划于2017年8月投入运行。[返回来源]