社会需要“电脑眼睛”
社会需要“电脑眼睛”

2016/03/31
社会需要“电脑眼睛” 实时异常检测技术应用于犯罪预防、卫星、医疗和农业
实验室里挤满了各种摄像机。这些都是我以前从未见过的,比如一个小型摄像机聚集成球形,一个八个摄像机水平排列。这里是产业技术研究院智能系统研究部计算机视觉研究组的实验室。特别是,他负责利用计算机进行视觉信息识别的研究,旨在通过图像分析等技术实现利用机器人进行异常检测以及利用计算机进行危险预测的自动化。该研究小组开发并致力于为社会“架起桥梁”的技术被称为“三次高阶局部自相关(CHLAC)”。该技术开发十年后,我们询问了研究人员对于将该技术投入实际应用的想法。
您不仅可以记录图像,还可以判断当前发生的异常
CHLAC是一种从摄像机图像中提取视频图像等有效自动实时检测异常和危险的特征的技术。该技术由大津伸之 (Nobuyuki Otsu)、小林拓海 (Takumi Kobayashi) 等人于 2005 年在 AIST 开发。
Kenji Iwata 是将使用这一基本技术的识别系统推向实际应用的“桥梁”人物之一。
这项技术可以替代人眼。而且,它不仅可以识别和记录视觉信息,还可以做出情境判断。我相信它可以用于以前需要人类视觉确认的各种任务和应用。''
进入2000年代,人们对安全保障的关注度不断提高,特别是东日本大地震后,对安全、安心的社会的需求更加强烈。另一方面,日本社会也面临着劳动人口减少的问题,对工作的省力化、自动化的需求不断扩大。在这种情况下,社会对以前依赖人类的异常检测技术自动化的需求增加,2013年,用于检测和分析卫星捕获图像中的异常的软件在美国被开发出来并投入实际使用。产业技术研究院正在广泛领域开展实践研究,包括癌细胞检测等医疗应用、农业自动化安全装置以及桥梁等混凝土结构的劣化诊断。
社会对异常检测技术的需求
CHLAC 视频识别准确率达到全球最高性能
让我们回到开发之初。 2000年代,各地安装监控摄像头,主要是为了预防罪案。然而,由于成本原因,很难持续监控监控摄像头的所有图像,并且在大多数情况下,记录的图像用于确认事故或犯罪的发生。除了成本问题之外,人类监控时保持持续的警惕并不容易。因此,人们强烈希望有一种系统能够自动识别并检测监控摄像机图像中的异常情况。
CHLAC 是为满足这些需求而开发的技术。在传统的HLAC(高阶局部自相关特征提取方法)中添加了时间轴,该方法在二维(垂直和水平)上进行图像处理,并且已扩展到处理运动信息。 CHLAC于2005年由AIST开发,同年在美国国家标准与技术研究所(NIST)举办的国际竞赛中被评为世界最高性能技术,作为一项显着提高运动图像识别精度的技术。
追求速度和易用性
岩田从这里开始参与,开始了面向实际应用的研究和开发。然而,运动视频的数据量远大于静止图像或音频,实时检测异常行为需要大量的信息处理。为了将该系统作为监控摄像系统投入实际使用,需要能够在笔记本电脑上执行繁重的工作量。
视频数据量非常大。此外,为了满足监控的需求,摄像机迅速变得更加复杂,因此我们认为有必要能够高速处理以 HD(高清晰度)拍摄的图像。''
Iwata 通过使用并行处理技术解决了这个问题,实现了 10 倍的加速。 2008年,创建了一个系统,可以使用笔记本电脑自动检测高清图像中的异常情况。
然而,仅此并不意味着公司会立即使用它。我们继续努力使该技术成为“人们可以使用的技术。”
如果你必须自己创建一个程序,这会花费金钱和时间。我思考如何创建一个用户可以轻松使用的工具。
开发了一个名为“Lavatube”的平台,该平台允许公司轻松创建适合自己产品的软件。使用 Lavatube,您只需将图标放置在屏幕上即可创建您需要的程序。每个图标都是各种图像处理程序的封装,例如“模糊”、“黑白”、“边缘提取”、“区域提取”、“轮廓检测”和“人脸识别”。用户只需选择要使用的处理图标并进行放置或排列,即可创建具有必要功能的软件。如果您想做的不仅仅是包提供的处理,您可以自由扩展功能。
通过实现这一简单性,使用 CHLAC 的识别系统向实际应用迈出了重要一步。
Lavatube 工作屏幕
只需在屏幕上放置指示图像处理的图标并以任意顺序连接它们(参见上图),您就可以轻松创建和自定义可以执行各种图像处理的程序(参见下图)。
以可用的方式展示它并让人们喜欢它
软件技术实用化的另一个难点是如何让用户真正了解其功能。无论你的技术多么出色,如果你只是用文字或 PowerPoint 来解释,你最终会得到这样的印象:“嗯,真的吗?”
这就是为什么我创建了一个演示示例,该示例实际上使用该软件执行图像处理,并尝试以可见的方式展示它。''
如果是为了癌细胞诊断,我们会创建一个与之相匹配的程序。然后,请医生提供样本图像,当场加载,并查看结果。事实上,它能够成功区分正常细胞和癌细胞,让非图像处理专家的医生相信它可能有用。 AIST 目前正在利用神奈川癌症中心提供的数据和知识开发医学影像诊断系统。
使用CHLAC的识别系统最初是用于监控摄像机的视频处理,现在预计将在医学、农业和基础设施恶化诊断等各个领域投入实际应用。图像学习和识别技术正在进一步发展,并且最近正在开发具有更高识别精度的方法,例如深度学习。计算机视觉研究小组融合了这些最新技术,并致力于通过反复改进方法并在现场进行调整来解决实际应用中的各种问题。
为了把技术带给社会,研究人员仅仅写论文是不行的。重要的是让用户意识到,“这个技术不是很好吗?”可以用!”然后,和有想法的人一起尝试一下,一旦开始做,你就能看到实际应用中的问题。”
如果能够获得多种实用的实验数据,就可以反馈到基础研究。通过基础研究和应用研究的相互交流,两类研究都取得进展。
目前,我们正在智能系统研究部所属的信息与人体工学领域研究战略部的协调和支持下,对收到的大量询问和咨询进行回应。
将优秀的基础研究与其他技术相结合并实现商业化的道路并不平坦。不过,AIST 有很多研究人员可以做到这一点。请提出请求并利用 AIST 的技术、人力资源和知识。''
CHLAC发展至今已经10年了。在社会中利用视频识别技术的运动终于获得了动力。
智能系统研究部
计算机视觉研究小组
首席研究员
岩田健二
岩田健二
请随时与我们联系
日本科学技术协会
信息/人体工程学领域
智能系统研究部
- 茨城县筑波市梅园 1-1-1 中央 2 号 305-8568