通过指南支持 AI 设计、开发和运营
通过指南支持人工智能设计、开发和运营

2022/03/22
AI设计、开发和运营 有准则支持 与日本队一起瞄准世界标准
2020 年 6 月,AIST,制定设计、开发和运营人工智能 (AI) 的指南并发布。使用本指南,与传统软件相比妥善进行难度极大的“AI质控”这是可以做到的。人工智能可以使用使用大量数据的机器学习技术,半自动地创建以前从头开始手动编程的各种功能。另一方面,人们担心人工智能可能会执行意想不到的操作,或者有时会失控。在本指南中,我们希望实现将为安全性、准确性和公平性分别定义级别,让利益相关者能够就质量达成共识为实现本协议所必需具体列出了数据条件和性能评估方法,通过满足这些公司可以保证他们开发的人工智能的质量事情就这样了。未来,我们将与企业和其他组织一起进一步细化和完善人工智能质量控制方法,同时也会与国际组织合作。成为全球标准指南目标是。企业开发者也是讨论的中心,来自不同立场的成员从编制指南的 AIST 角度和使用指南的公司角度分享了他们对指南的期望。
对人工智能的期望和担忧
人工智能的出现即将彻底改变社会。人工智能正在融入企业制造的各种产品中,不仅使人们的生活更加便利,而且改变了人们的工作方式。日常生活中的各类信息都经过人工智能的整理和处理,人们利用人工智能来享受音乐、视频、购物。随着人工智能的引入,自动驾驶汽车正在成为现实,毫无疑问它将彻底改变交通方式。
人工智能的使用让人们的生活更加便利,给社会带来诸多好处,但另一方面,人们的焦虑和社会担忧依然存在,比如对人工智能安全性的担忧,比如人工智能可能变得不可控的可能性,比如对人工智能将被使用的领域的担忧。
这种焦虑日益加剧的原因之一是人工智能本身的特性。与传统软件中每个功能都是由程序编写和实现的不同,人工智能是一个自我生长的系统,利用机器学习技术基于大量数据直接获取功能。例如,如果你想让人工智能识别图像中的人脸,传统方法需要人类设计师思考和开发整个机制。他们设计了一种将眼睛、鼻子和嘴巴的形状和位置等面部特征传递给计算机的方法,并且在图像中查找和判断这些特征的过程也是手工编程的。相比之下,人工智能开发中使用的深度学习技术从大量数据中学习人类面部特征,并利用它们几乎自动创建面部识别功能。
2019年3月,政府综合创新战略推进委员会决定“以人为中心的人工智能社会原则”,以消除对人工智能的此类担忧。同年5月,经济合作与发展组织(OECD)通过了《人工智能原则》。两者在开发人工智能时都需要保证安全性和公平性。
AIST 于 2018 年开始制定人工智能设计、开发和运营指南,先于政府和其他机构采取这一行动。此时正值人工智能的社会落地日益活跃,公众对人工智能发展的未来,包括确保人工智能安全的焦虑开始上升。 AIST成员认为,为了消除这种社会焦虑并促进AI发展,有必要制定指导方针来确保AI的质量,这就是AIST作为公共机构的作用。同时,我们认为,真正开发和利用人工智能的企业的理解和合作也很重要,我们呼吁他们参与讨论和工作,目的是利用我们与企业和研究机构的现有联系,制定结合和使用企业需求的指南。就这样,来自多家具有相同问题意识的公司的开发人员和研究人员成为核心群体,与产业技术研究院和其他研发机构的研究人员合作,共同开展一个重大项目,制定指导方针,支持人工智能的设计、开发和运营。
安全、性能和公平是质量的支柱
即使我们制定了设计、开发和操作人工智能的指南,执行起来也并不容易。这是因为世界上没有明确的标准来衡量人工智能的质量和性能。
那么团队在制定指南时重点关注的是什么?与传统软件不同,人工智能是通过学习行为自动改进其功能的软件。这是AI最大的优势,但也会带来失控行为等问题。为了利用人工智能的优势并防止其执行不方便的操作,我们应该建立和检查什么?该团队将人工智能中重要的品质大致分为三类。 ①人工智能输出的结果是安全的(指南中的术语是“风险规避”),②结果是高度准确的(指南中的“人工智能性能”),3)结果是公平的(指南中的“公正”)。
为①至③的每个类别设置了不同的级别,以便在开发时进行选择。这是因为要准备的数据的质量和数量以及多少测试才足够,将取决于人工智能要达到的质量水平,取决于人工智能的目的。例如,自动驾驶所需的安全级别自然会与使用AI的图像识别功能标记图像时所需的安全级别有所不同。
针对人类风险的人工智能安全级别 (AISL) 估计标准
(对于标有 * 的部分,适用与功能安全相关的其他标准。
详情请参阅指南第二版第48页。 )
该指南根据要求的严重程度,为(1)“风险规避”设立了七个级别,为(2)“人工智能性能”和(3)“公平”设定了三个级别。然后总结了设计、开发和操作人工智能以实现每个级别时必须遵循的要求。具体来说,需求被描述为“问题域分析的充分性”、“数据集的覆盖度”等九大类。一旦确定了目标水平,相应的需求也随之确定,满足这些需求,才能保证正在开发的AI的质量。
例如,如果目标是达到最高水平的风险规避,那么问题领域分析(A-1)的要求水平将不可避免地变得更高。引用该指南,它指出,“有必要调查过去类似研究的文献,并记录得出结论的研究进展”,这与产品责任所需的水平类似。我们应该准备多少高质量数据以及多少测试就足够了?这取决于你想将你开发的AI质量提高到什么程度。再次强调,关键是如何在开发者和用户之间建立共识。这三项品质和九项要求是经过详细讨论并借鉴公司成员的知识而确定的,目的是在质量要求和实现这些要求所需的努力之间取得平衡,并在许多实际情况下可以接受。
人工智能的三大品质和九大要求
(*部分摘录自指南第二版第9页并进行修改)
指南提供了这个级别的说明,抽象级别可能太高,无法用于个人开发。因此,团队准备了一份参考指南,介绍了每种用途的具体应用示例。英文版已经提前出版,日文版的发行准备工作也已经开始。
在利益相关者之间建立共识很重要
项目团队认为,在使用该指南时尤为重要的一点是在涉及人工智能开发的一方和承包开发的一方之间建立共识。据称,基本原则是在双方达成共识的前提下开展工作,不仅是质量水平的确定,而且是由此产生的细节要求。
越是追求AI的品质,开发所需的成本自然就越高。需要统一所有相关方的意愿,决定两者之间的界限在哪里。如果你在这里偷工减料,人工智能可能会以意想不到的方式行事,从而导致以后出现问题。
作为团队负责人领导该指南工作的数字建筑研究中心副主任 Hiroshi Oiwa 通过提到自动驾驶来解释这一点。 “例如,对于在某个区域运行的公共汽车,可能可以让它在晴天或雨天自动运行,但在下雪天,可以将其设置为不在保修范围内,而必须手动驾驶。”如果制造商和用户能够就这些具体细节达成一致,万一发生事故,双方之间应该不会产生冲突。
这些条件不是一次协商就能决定的。从业务需求和开发站点之间的意见交流中逐渐产生想法,似乎将成为常态。此外,即使在相同的开发中,概念验证 (PoC) 阶段和实际产品的开发阶段所需的质量也可能有所不同。此外,即使人工智能投放市场后,它仍会继续接受再培训,以维持和提高其性能。在每个阶段,所有相关方达成适当的协议非常重要。
AI 开发的标准流程
制定指南的转折点是以达成共识为大前提。团队副组长、创新推进本部标准化推进中心委员濑野芳树回忆道:“2020年1月下旬,疫情爆发前夕,我们把参与该项目的企业和研发机构的成员聚集在一起进行训练营。在那里,我们想到了在质量建设方面有两种意见,一种是业务方,另一种是制造商方,最后最好结合起来。”就我个人而言,我们能够就这个想法达成共识真是太好了。”顺便说一句,这次集训期间,讨论很激烈,日语和英语混杂在一起。
利用真实数据提高准确性并成为国际标准
团队的努力已经取得了丰硕的成果。第一版指南于 2020 年 6 月发布 (2020/6/30 新闻稿),并于同年11月发布了可用于按照指南创建质量评估环境的软件。库诺蒙'' 已免费发布。第一个英文版于2021年2月发布,第二个日文版于同年7月发布,第二个英文版于2022年2月发布,从而迅速获得成功。 2022年3月,我们还计划发布参考指南,其中包含应用示例,供从业者参考。 (机器学习质量管理指南和附件)
可用于根据准则创建质量评估环境的软件。库诺蒙」
我们未来的重点之一将是收集实际站点中人工智能使用的示例。当前的参考指南介绍了使用任何人都可以使用的开放数据的案例,这无疑是缺乏的。团队拟拜访国内企业,收集人工智能在该领域的实际应用案例。然而,用于人工智能开发的数据可以被认为是公司“保守得最好的秘密”,公开的门槛很高。因此,我们的目标是通过向合作企业提供福利,例如来自AIST的全面开发支持,来突破障碍。
作为日本队,我们的最终目标是使这些指南成为国际标准。 Leader Oiwa 启动了一项战略,在注册国内标准日本工业标准 (JIS) 之前,先向国际标准化组织 (ISO) 的标准靠拢。 “如果JIS在几年内完成,然后我们将其翻译成英文并提出,我们会收到各种各样的意见,因为这是一个快速发展的领域,最终的结果会有所不同。然后,我们的策略是从一开始就用英文讨论并创建ISO标准。”
我们已经与负责人工智能的ISO小组委员会“SC(Sub-Committee)42”合作,并努力确保本指南的内容反映在负责“可靠性”的工作组正在准备的题为“功能安全和人工智能系统”的技术报告中。
2021年4月,欧盟(EU)提交了人工智能监管法案,6月,美国国家标准与技术研究院(NIST)开始致力于创建“人工智能风险管理框架”,海外对人工智能质量施加法律约束的运动日益盛行。尽管欧盟可能需要一段时间才能通过立法和NIST框架对美国政府采购产生影响,但可以肯定的是,世界各国对人工智能的质量高度感兴趣。该团队继续稳步努力,相信全球对高质量人工智能的需求将会增加,并且日本公司将负责构建许多重要人工智能系统的那一天将会到来。
(本活动是国家研究开发机构新能源产业技术综合开发机构(NEDO)的委托工作(JPNP20006)进行的。)
信息/人体工程学领域
数字架构
研究中心
研究中心副主任
大岩浩
大岩丰
创新推进总部
标准化推进中心
审议者
濑野芳树
徐芳树
信息/人体工程学领域
数字架构
研究中心
特邀研究员
小西浩一
小西光一
富士通有限公司
人工智能研究院
AI 质量项目
首席研究员
小林健一
小林健一
日本科学技术协会
信息/人体工程学领域
数字建筑研究中心