国立先进产业技术综合研究所[会长石村和彦](以下简称“AIST”)网络物理安全研究中心[研究中心主任松本勉]软件质量保证研究组[研究组组长大岩浩]和人工智能研究中心[研究中心主任辻井淳一]与民间企业和大学的专家合作,系统总结了设计中的质量管理和人工智能系统的开发。机器学习质量管理指南》已发布在网络物理安全研究中心网站上。
网址:https://wwwcpsecaistgojp/achievements/aiqm/
质量管理对于安全可靠地管理 IT 系统至关重要,但由于使用机器学习的 AI 系统是通过使用训练数据学习间接构建的,而不是依赖于开发人员明确的程序指令,因此质量管理比一般软件困难得多。本指南适用人工智能系统生命周期涉及全面质量管理,系统总结了满足提供人工智能系统服务所需的质量要求所需的努力和检查项目。为了促进参与开发的各方之间就质量问题进行沟通,该指南规定了使用人工智能系统时所需的质量要求(1)风险规避、(2)人工智能性能、(3)公平三外部质量9122_9187内在品质期望人工智能系统的开发者和用户能够就系统所需的质量要求达成一致,消除质量不透明,加速人工智能系统的商业利用。

机器学习质量管理指南
使用机器学习的人工智能系统通过使用训练数据进行学习来间接获取功能,而不是通过开发人员通过程序直接发出指令。因此,即使检查作为开发产品的软件程序的文本,也不可能检查是否已经实现了期望的功能和质量。这使得人工智能系统的质量管理比通用软件的质量管理要困难得多。未来,为了让人工智能系统在各种应用中发挥价值,例如自动驾驶、机器人控制等需要安全确认的领域,以及个人贷款的信用管理等需要公平性的领域,质量管理至关重要,让人工智能系统可以安心使用。近年来,除了日本内阁府“综合创新战略推进委员会”决定的“以人为中心的人工智能社会原则”外,OECD、欧盟等海外多个组织也就人工智能技术的社会接受度提出了建议,并迫使从事人工智能系统开发和使用业务的企业做出回应。此外,为了将人工智能系统和人工智能组件作为供应链中各种系统的一部分进行整合和利用,必须有一个框架来定义参与人工智能系统开发的人员并就质量达成一致。
目前人工智能系统的质量还没有量化的评估标准,因此在订单等交互过程中往往需要时间沟通来确认系统需求,从这个角度来看,也需要一个全面的质量管理体系。然而,对于人工智能系统质量要求的定义,或者检查人工智能系统是否满足要求的特征和方法,目前还没有系统、全面地编制整个系统生命周期的标准或规范。从事人工智能系统开发和使用的企业需要向社会说明整个人工智能系统建设过程中的质量管理和质量管理的成果,因此制定这样的指南是值得期待的。
在技术发展方面,许多AI系统的性能评估技术已经被开发出来并在研究会议等上展示
人工智能产品质量保证联盟《人工智能产品质量保证指南》总结了如何应用此类性能评估技术以及确保每个应用示例质量的注意事项。此次发布的指南充分考虑了此类技术发展的成果,整理了实际人工智能系统开发场所应采取的人工智能质量管理方向。
本指南作为国家研究开发机构新能源产业技术综合开发机构 (NEDO) 的合同项目于 2018 年进行了研究。1,“与人一起进化的下一代人工智能技术开发项目/建立现实世界中可靠的人工智能评估和管理方法/研究开发机器学习系统的质量评估指标和测量测试平台”,于2020年过渡,由AIST与来自企业、大学、国家研究机构等的专家委员会共同组织。机器学习质量管理审核委员会'' 以AIST起草的草案为基础,经过审查委员会两年的讨论和审查,制定了第一版指南。
1 从2018财年到2019财年,该指南是在“下一代人工智能/机器人核心技术开发/全球研发领域/机器学习AI质量保证的研发”项目下实施的,这些指南是该项目的成果。
● 指南的定位
本指南遵循内阁府“综合创新战略促进委员会”的“以人为中心的人工智能社会原则”,并提供了评估人工智能系统质量的框架和方法。该指南为人工智能系统和使用机器学习技术实现的软件组件(机器学习元素)设定了质量标准和目标。目的是帮助使用该指南的企业自行衡量和提高使用人工智能的产品质量,减少人工智能误判造成的事故和经济损失。此外,通过这种方法,所取得的质量可以在参与发展的各方之间共享,质量可以作为一种标准向社会展示。通过这样做,可以明确订单等问题的条件,发现问题,并通过高质量呈现附加价值,从而有助于实现“创造优秀人工智能系统的企业受到更多重视”的健康商业环境。
● 指南概述
使用机器学习的人工智能系统的“质量”
- 使用 AI 系统时需要“使用质量”
- AI 系统中机器学习元素所需的“外部质量”
- 机器学习元素本身的“内在品质”
本指南根据审核委员会的分析和讨论,确定了机器学习元素特有的三种外部品质:“风险厌恶”、“AI 性能”和“公平”。人工智能系统的使用质量也是基于这三个因素来表达的。
另一方面,对于内部质量,我们分析了机器学习要素的构建过程以及性能恶化的原因。 (4)“数据集的一致性”,(5)“机器学习模型的准确性”,(6)“机器学习模型的稳定性”,(7)“程序的健全性”,(8)“运行质量的可维护性”8 项(图2)。这些内在品质通过过程控制和数值评价具体确认,以达到外部品质的要求。
指南要求的质量管理范围不仅延伸到机器学习要素的开发,还延伸到整个系统生命周期,包括质量需求定义、演示实验、系统开发以及包含机器学习要素的人工智能系统的维护和运行。根据各个AI系统、服务提供商和系统开发商的开发情况(SI 供应商·工程师)之间进行划分,并且这些质量管理要求将得到满足。预计它将用于在订购和外包开发工作时建立共识,并设定验收条件。
本次发布的第一版指南是由独立行政机构日本科学技术振兴机构 (JST) 与机器学习质量管理审查委员会参与实际 AI 业务的公司成员经过两年讨论后制定的,并于 2019 年 12 月制定。它是经过信息技术促进局(IPA)和大学的专家以及产品质量保证联盟主要成员审查后制定的,已完成总体质量评估框架,已达到可在企业应用和评估的阶段。
请注意,这些准则是供主导开发使用人工智能系统的系统和服务的公司根据对业务的影响等独立选择是否采用,并与共同开发者和其他人一起实施的,不具有法律和公共准则的约束力。

图1质量实现总体结构

图 2 需要关注的内部质量特征
未来,基于实际业务中的应用及其反馈,我们将继续开发NEDO项目``与人一起进化的下一代人工智能技术开发项目/建立现实世界中可靠的AI评估和管理方法/研究和开发机器学习系统的质量评估指标和测量测试平台。在这个项目中,我们计划定期修订指南并创建英文指南,创建参考指南作为实际工业应用的具体应用示例,利用这些指南构建支持评估工作的软件开发平台,并开发各种评估技术。此外,在日本,我们的目标是通过在利益相关者之间广泛使用它来进行质量管理,使其成为事实上的标准,同时,我们计划开展国际标准化活动,例如ISO/IEC JTC1/SC42(人工智能)提案。