- 输入人脸与其他物体的合成图像,利用AI分析与情感词的内容匹配程度
- 人工智能证实了“恐怖谷”现象,即与人类相似的物体被判断为令人不快
- 预计用于与人类相关的机器人和化身设计

以人工智能为人体模型,通过心理实验验证恐怖谷现象
(*原论文中的数字是引用并修改的。)
米乐m6官方网站(以下简称“AIST”)人类信息交互研究部的高级研究员林龙介和研究助理伊贺也利用人工智能分析了情感词与人脸和其他物体的合成图像的内容匹配程度,并证实了“恐怖谷”现象,即与人类有一半相似的物体被评估为不愉快的现象。在实验中,我们使用了现有的经过训练的模型,该模型是人工智能的标准,可以用语言表达图像的内容。然后,通过改变人物图像与其他物体图像的合成程度,将约5000张人性化程度被操纵的图像和总计超过10000个单词输入到AI中,分析图像与单词之间的内容匹配程度。结果发现,AI针对图像人性的变化,也表现出类似恐怖谷现象的评价倾向。该研究成果是全球首次利用人工智能进行恐怖谷研究。未来,它展示了用于人类熟悉的机器人和化身的设计评估方法的可能性,并将有助于人性化界面技术的发展。
这项研究得到了日本科学技术振兴机构登月研究开发项目 (JPMJMS2012) 和基于 NICT 委托研究项目和国际联合研究计划的日美协作脑信息和通信研究 (项目 22301) 的支持。
研究结果详情将于 2023 年 5 月 19 日(日本时间)公布。计算机在人类行为中的作用发布
机器人和 CG 头像预计用于与人类交流,因此必须考虑其设计以营造熟悉感。当机器人和 CG 头像在外观和行为上与人类相似时,观察者往往会对它们产生更大的亲和感。另一方面,据说当这些角色在外貌和行为上变得与人类更加相似时,会让人感觉很奇怪,甚至令人毛骨悚然(图1)。这种心理现象被称为恐怖谷现象。克服恐怖谷现象作为机器人和 CG 工程领域的挑战而受到广泛关注。尽管迄今为止对恐怖谷进行了心理学和神经科学研究,但关于其认知机制的争议尚未解决。

图1 恐怖谷现象图解
(*原论文中的数字经过引用和修改。)
AIST 一直在进行研究,利用模仿人类感知和认知功能的 AI 技术探索人类大脑功能。另一方面,近年来出现了能够用自然语言描述图像内容的人工智能技术。因此,在本研究中,我们通过分析最新的图像评价AI使用哪些情感词来评价各种图像,来探索与恐怖谷现象相关的人类情感评价的特征和趋势。
这项研究得到了基于 NICT 委托研究项目和国际联合研究计划的日本科学技术振兴机构登月研究与开发项目 (JPMJMS2012: FY2021-2025) 和日美合作脑信息与通信研究项目 (项目 22301: FY2022-2025) 的支持。
剪辑学习图像和解释文本之间的对应关系,并可以输出两者含义的一致程度。用于学习的解释性文本是人类在查看图像后创建的。因此,这个人工智能正在学习的可以说是“人类用语言表达图像内容的倾向”。在这项研究中,我们的想法是将各种图像输入到这个人工智能中,并检查哪些单词(特别是与情感表达相关的单词)与内容相匹配,以探索“人类倾向于将什么样的图像与什么情感表达联系起来”。通过使用人工智能,我们可以全面调查大量图像与情感单词之间的对应关系,这在传统的人类心理学实验中是困难的。
“人脸图像”和“其他物体图像”作为心理学研究恐怖谷现象的方法变形这样做的方法是逐步操纵对象的“人性”,然后要求观察者对与对象的亲和程度进行评分。在这项研究中,我们创建了属于五个类别的逼真 3D CG:人脸、猴脸、汽车、食物和鞋子,然后创建在不同对象类别之间分五个阶段变形的图像,并将它们用于实验(总共 5,040 张图像)。
此外,在心理学中,有一种方法可以评估一个人对某个物体的印象程度,使用分级数值作为“亮 - 暗”等问题的答案 (SD 方法)。利用这种方法,有人提出使用“人性”、“恐怖性”和“吸引力”三个指标来有效评估恐怖谷现象(Ho & MacDorman,2017)。1另一方面,CLIP学习到的海量图像描述数据中包含了表达各种情感的词语。
因此,在第一个实验中,我们使用CLIP学习模型来分析SD方法中包含的形容词组与变形图像之间的内容匹配程度。首先,我们将为实验创建的变形图像和SD方法问题项中包含的形容词输入到AI中,并输出内容匹配的程度。接下来,将输出值汇总为三个指标值的结果,确认了随着“人脸图像”的合成程度增加,AI的“人像度”指标的值也增加。此外,还发现,对于图像的人性处于中间的变形图像,“毛骨悚然”指数和“吸引力”指数分别取最大值和最小值,表现出类似于恐怖谷现象的趋势。这一结果意味着用人工智能重现“恐怖谷”现象是可能的。 (图2)。

图2 AI确定的“拟人性”、“恐怖性”、“吸引力”指数值与图像拟人性之间的关系
标有*的级别表示与所有其他级别的指标值存在统计上的显着差异。
*的数量越多,指标值的显着差异越大。
(*原论文中的数字经过引用和修改。)
在第二个实验中,我们准备了30个与“人类”和“僵尸”相关的名词,而不是SD方法中使用的形容词,这是恐怖谷的典型例子。然后,和第一个实验一样,我们使用 AI 来分析变形图像的含义与这些名词组之间的一致程度(图 3)。结果证实,随着图像变得更像人类,与“人类”相关的名词之间的一致性程度增加。另一方面,具有中等变形水平的图像与与“僵尸”相关的名词的一致性最高。换句话说,人工智能确定具有中等变形水平的图像与令人毛骨悚然的角色非常吻合。

图3 AI对“人类”相关名词组和“僵尸”相关名词组的评价值与图像人性的关系
标有*的级别表示与所有其他级别的指标值存在统计上的显着差异。
*的数量越多,指标值的显着差异越大。
(*原论文中的数字经过引用和修改。)
最后一个实验涉及敏感性研究(Susanto等人., 2020)2中提出的 24 个情感类别中包含的一组形容词(总共 630 个单词)。结果显示,与“厌恶”、“强烈厌恶”、“恐惧”和“恐怖”等与“令人毛骨悚然”密切相关的负面情绪类别的一致性程度在中间变形水平时最高(图4)。

图4 AI对24种基本情感相关形容词组的评价值与图像人性的关系
标有*的级别表示与所有其他级别的指标值存在统计上的显着差异。
*的数量越多,指标值的显着差异越大。
(*原论文中的数字经过引用和修改。)
上述实验结果是全球首次证明人工智能可以用于研究像图像恐怖谷现象一样的情感评估趋势。这项研究的结果和实验方法表明,人工智能在设计人类熟悉的机器人和化身时可以作为一种有用的评估方法,并将有助于人性化界面技术的研究。
1C -C。何和 K F 麦克多曼。 “衡量恐怖谷效应。”国际社交机器人杂志,9,第 129-139 页(2017 年)。 doi:101007/s12369-016-0380-9
2是。苏珊托、A G 利文斯通、B C Ng 和 E 坎布里亚。 “重新审视沙漏模型。”IEEE 智能系统,35(5),第 96-102 页 (2020)。 doi:101109/MIS20202992799
未来,我们希望基于神经科学知识,开发更接近人脑信息处理的人工智能,重现更接近人类的感知和认知功能。随着这种人工智能的实现,预计将有可能像人类一样自动评估各种图像的敏感度。机器人和化身有可能被创造出来,能够进行传统技术难以做到的人性化互动。
已出版的杂志:计算机在人类行为中的作用
论文标题:人工神经网络中恐怖谷效应的特征
作者:伊贺拓也和林龙介
DOI:101016/jchb2023107811