米乐m6中国官方网站利用深度学习开发红外图像着色技术

-红外图像可见光彩色图像的颜色再现性显着提高-

积分

深度学习显着提高了红外夜视图像的可见光彩色图像的色彩再现性
红外视频可实时着色
预计应用于高度可见的安全摄像头和夜行动物的生态记录

摘要

米乐m6官方网站[理事长中钵良二]（以下简称“AIST”）分析测量标准研究部[研究主任野中英彦]纳米光谱研究组长宗泰首席研究员是多层次研究员人工神经网络深度学习开发了红外图像的可见光着色技术。因此，以前只能以单色或近似彩色显示的红外夜视图像现在可以以非常接近可见光下看到的颜色的颜色显示。

图 1

发展的社会背景

由于近年来预防犯罪意识的增强，对安全摄像头、监控摄像头等安全摄像头的需求不断增加。然而，用于夜间摄影的传统红外摄影技术产生的图像是单色或近似彩色的。可见度有问题从减少显示器疲劳的角度来看，需要一种具有高可视性的摄影技术。

另一方面，使用深度学习机器学习近年来，由于计算机计算能力的提高和计算技术等基础技术的发展，其在语言、图像、音频、机器控制、优化技术等各个领域得到应用。与此开发相关的图像转换包括插图和动画的自动着色以及单色图像的着色等应用。另外，对于可见光图像和红外图像亮度信息

研究历史

AIST 开发了红外彩色夜视摄影技术，仅使用红外照明即可捕获拍摄对象的彩色视频。2011 年 2 月 8 日、2012 年 12 月 3 日、2014 年 5 月 14 日AIST 新闻稿）。物质的颜色取决于其在可见光范围内的反射特性，但可见光范围内的反射特性与红外光范围内的反射特性之间存在差异。相关性是一种可见光着色技术，可根据相关性从红外图像中再现可见光下物体的颜色。但相关性较弱，无法完美再现被摄体的色彩。因此，我们致力于开发可见光着色技术，利用深度学习来更完美地再现被摄体颜色的红外图像。

研究内容

这次可以提取和学习图像特征 CNN之间的关系并可获知时间序列信息 RNN的深度学习方法，我们开发了一种通过构建同时学习亮度信息和颜色信息的模型将红外静态图像和红外视频转换为可见光颜色的技术。

图 1 是用没有红外截止滤光片的普通相机拍摄的一组物体（例如碗和杯子）的图像。图1(a)为可见光下的正常彩色图像，图1(b)为红外照射下的正常红外图像，图1(c)为利用现有技术将红外图像转换为可见光颜色得到的图像(将中心波长为780 nm、870 nm、940 nm的图像分别转换为红、蓝、绿得到的图像)，图1(d)为图1(b)中的红外图像转换为可见光颜色的图像。采用新开发技术的光色。比较图1(c)和图1(d)，可以看出图1(d)中的颜色再现性得到了极大的改善，达到与图1(a)无法区分的程度。

虽然这里使用的是基于CNN的模型，但是通过改变输入图像来学习过度拟合抑制或普遍性方面的改进预计。因此，我们使用图1（b）及其镜像、反转和旋转图像作为输入图像，训练图1（a）及其镜像、反转和旋转图像作为教师图像，将图1（b）输入到训练模型中并进行变换以获得图1（d）。此时的转换时间约为30ms，可以进行实时转换。

此外，对于使用硅图像传感器的普通相机，在红外区域中，彩色滤光片的光谱特性在直至约 850 nm 之间都存在差异，因此图 1(b) 中的红外图像看起来是彩色的，但由于与单色图像相比信息量增加，因此我们也使用该光谱信息进行学习。通过使用在红外区域具有特殊光谱特性的相机（例如AIST开发的红外彩色夜视相机）拍摄的具有更多信息量的图像，可以进一步提高学习效率。

图 2

另一方面，由于信息量比彩色图像小，因此学习时间较长，但也可以将红外单色图像转换为可见光彩色。图2是比色图表的照片；图2（a）是可见光下的正常彩色图像，图2（b）是红外照射下的正常红外单色图像（中心波长870 nm），图2（c）是常规红外彩色图像（中心波长780 nm，870 nm，940 nm），图2（d）是使用CNN模型将图2（b）转换的红外彩色图像。

图 3

如图2(c)所示，传统的红外彩色图像很难对红外线容易穿透的纸张和布料等薄材料进行着色。通过使用光学彩色图像作为训练图像的深度学习，即使是在红外区域没有光谱信息的红外单色图像也可以转换为彩色，并且可以看出，与图2（c）相比，颜色再现性显着提高。

图 3 显示了转盘旋转时拍摄和记录的视频的两个特征帧，显示了一组红色、绿色和蓝色以太网连接器盖，它们放置在蓝色塑料板前面的转盘上。这里，图3(a)和(b)中，左上为一帧可见光视频，右上为一帧红外视频，左下为利用CNN模型转换红外视频得到的一帧红外彩色视频，右下为利用RNN模型转换红外视频得到的单帧红外彩色视频。

此外，这里我们使用了1153帧约38秒的红外视频和相应的可见光视频作为教师视频，使用CNN模型或RNN模型训练每个模型，并将红外视频输入到每个训练模型中以获得每个红外彩色视频。

由于 RNN 模型需要时间来学习，因此在图 3(a) 中，RNN 模型创建的图像存在一些粗糙度，这似乎是由于学习不足造成的，但在图 3(b) 中，RNN 模型创建的图像似乎优于 CNN 模型。当存在形状相似的物体时，根据图像特征估计颜色的 CNN 模型有时会混淆识别，但这似乎表明考虑时间序列信息之间关系的 RNN 模型已经改善了这一点。

通过进一步改进这项技术，预计它将应用于高度可见的安全摄像头和夜行动物的生态记录。

未来计划

未来，我们将尝试通过提高深度学习模型的复杂度以及收集和训练大数据来提高泛化性，提高图像质量，实现更完美的色彩再现。

术语解释

◆人工神经网络: 使用数学模型近似表示人脑中的神经网络。[返回来源]
◆深度学习: 使用计算机的机器学习方法之一。也称为深度学习。[返回来源]
◆可见度: 物体是否清晰可见的特性。[返回参考源]
◆机器学习: 一种数据分析方法，计算机使用程序重复学习数据并尝试找到某些模式。 AI（人工智能）技术的方法之一。[返回来源]
◆亮度信息: 有关单位面积亮度的信息。对应于单色图像的阴影。[返回来源]
◆相关性: 两个变量之间的关系。一种关系，如果一个人改变，另一个人也会改变。[返回参考源]
◆CNN: 卷积神经网络的缩写，深度学习方法之一。由于可以通过卷积提取空间信息的特征量，因此特别用于图像学习和信息处理。也称为卷积神经网络。[返回来源]
◆RNN: 循环神经网络的缩写，深度学习方法之一。由于时间序列信息可以关联和处理，因此适合学习随时间变化的事物并预测未来。也称为循环神经网络。[返回参考源]
◆过拟合: 深度学习模型与所学习的数据过于吻合，从而降低了普遍性。[返回来源]
◆普遍性: 深度学习模型的预测性能。[返回参考源]

联系我们

查询表

米乐m6中国官方网站 利用深度学习开发红外图像着色技术

积分

摘要