公告/发布日期:2019/08/21

mile米乐m6官网 开发了一个支持大规模自由文本调查问卷的系统

-发布网络调查系统用于演示实验-

积分

  • 开发了一个“投票聚类”系统,可以聚合数万人的自由文本回复
  • 可以使用图分区算法进行聚合,这是一种机器学习
  • 任何人都可以轻松进行大规模开放式网络调查

摘要

在问卷调查中,性别、年级等数据很容易机械处理,但以自由文本格式表达的意见却很难机械处理,难以进行大规模的问卷调查。产业技术综合研究所 (AIST)人工智能研究中心的研究员Tatsuro Kawamoto与技术人员Kei Yamashita和Aoi Takahashi合作,开发了一种调查方法“投票聚类”(英文名称:voteclustering)系统,该系统利用机器学习从大规模自由文本回复文本中高效聚合意见,并发布了接受演示实验的网站(图1)。

投票聚类方法由香川大学教育学部川本研究员和青木隆明副教授共同开发,详细信息可以参见 Springer Nature 2019 年 7 月 9 日出版的机器学习领域科学期刊自然机器智能(DOI:101038/s42256-019-0071-y,SharedIt:https://rdcube/bJpUy)。

图1
图1:示范实验现场(https://aistaircgithubio/prom-vc-ja/)首页

研发社会背景

民意调查等收集人们意见的调查是重要且常用的方法。然而,传统的问卷调查存在根本性问题。选择题问卷允许受访者表达对预先准备的候选答案的认可或不认可,如果候选答案不包含受访者的真实想法,可能会导致不准确的结论。另一方面,开放式问卷允许受访者自由地以文字形式回答,在收集答复后很难汇总大量意见。也有一些利用自然语言处理技术的处理方法,但存在需要目标领域相关的词典和大量例句数据等问题,并且不能保证正确理解含义。因此,大规模、准确收集、汇总不同意见的问卷调查极其困难。

研发历史

人工智能研究中心的随机建模研究团队通过购买行为数据、摄像头等传感器数据和问卷调查日常生活中的现象,对其进行概率建模,并使用模拟和预测来观察日常生活中的现象,进行旨在改善零售和客户服务等各种服务的研究和开发。作为这项工作的一部分,我们一直致力于大规模开放式问卷调查方法的研发和社会实施,这是观察日常生活中价值观和观点的重要方法。

该系统开发是国家研究开发机构新能源产业技术开发机构委托的项目的成果,该项目名为“下一代人工智能和机器人的核心技术开发/下一代人工智能技术领域/与人类可以相互理解的下一代人工智能技术的研究和开发。”

研发内容

投票聚类的主要特征如下。

1。使用传统的调查问卷创建程序比以前更容易收集意见

创建调查问卷时,调查问卷实施者将问题内容和若干候选答案登记在“调查问卷设置系统”中(图2)。制作方法与传统的多项选择问卷类似,因此即使熟悉传统方法的人也可以轻松上手。此外,由于最初未列为选项的答案由受访者添加到候选列表中,因此它省去了实施者思考选项的麻烦。随着问卷的进行,候选者给出的答案会动态变化,因此最初的选择并不具有主导影响。

此外,在传统的自由文本调查问卷中,分析师必须阅读所有答案并确定其含义,但在新开发的系统中,只要调查问卷的结果是可解释的,只需阅读少量有代表性的回复,就可以破译分类意见的含义。

2。回答程序可提高认识,同时消除自由写作的复杂性

调查问卷系统向受访者提供从其他受访者中随机选择的固定数量的回答。每位受访者都回答,无论答案是否符合自己的观点,如果答案中没有包含自己的观点,他或她可以自由写下自己的答案(图3)。受访者的过程与常规调查没有什么不同,他们也能够找到与自己观点相似的答案候选者。投票聚类的一大特点是让受访者在问卷调查过程中参考其他人的意见,让受访者能够进行更深入的思考,从而提取出不同的意见。

图2
图2:调查设置系统屏幕
 
图3
图3:输入答案意见
 

3。问卷数据聚合技术

为了呈现候选答案,我们首先获取连接受访者判断(同意或不同意)的图形(网络)数据,作为通过网络调查系统获得的意见反馈的集合(图 4)。图数据是机器学习算法之一图划分算法进行处理,可以编译类似的意见答案。向每个受访者提供的其他人的答案越多,通过图分割获得的意见聚合结果就越精确。使用这种方法,即使是在人口众多的调查中,只要能够处理受访者的解释和比较结果,就可以聚合不同的意见。

图4
图 4:根据答案生成图表数据
 

通过投票聚类提取社会中的不同意见,并以易于理解的格式聚合它们,对于实现更高水平的民主社会极其重要,并且有望用于各种情况。

未来计划

未来示范实验场(https://aistaircgithubio/prom-vc-ja/,图1),我们将提供广泛的大规模开放式问卷调查的机会,并进行重复的论证实验。通过投票聚类收集的数据将在 AIST 进行分析,并将结果提供给调查用户。通过此,我们将验证系统的有效性,推进更精准的数据处理方法的研发,并力争将其转化为实际服务。

查询

国立产业技术综合研究所
人工智能研究中心概率建模研究团队
研究员 Tatsuro Kawamoto 电子邮件:kawamototatsuro*aistgojp(发送前请将 * 更改为 @。)

人工智能研究中心概率建模研究团队
研究团队负责人 Yoichi Motomura 电子邮件:ymotomura*aistgojp(发送前请将 * 更改为 @。)


术语解释

◆图划分/图划分算法
从图(网络)数据中提取特征结构的机器学习问题称为图分割。图划分算法是执行图划分的过程。[返回来源]