首页 > 研究结果搜索 > 研究成果文章列表 > 2020 > 发布机器学习质量管理指南

公告/发布日期：2020/06/30

mile米乐官方网站发布机器学习质量管理指南

－利用人工智能安全可靠地管理产品和服务的质量－

积分

发布使用机器学习的人工智能系统的质量控制方法指南，该系统被认为难以管理
对机器学习 AI 系统的质量要求进行分类和整理，并构建一个允许开发者客观评估它们的框架
瞄准国际标准化，同时通过企业使用和反馈提高实用性

摘要

国立先进产业技术综合研究所[会长石村和彦]（以下简称“AIST”）网络物理安全研究中心[研究中心主任松本勉]软件质量保证研究组[研究组组长大岩浩]和人工智能研究中心[研究中心主任辻井淳一]与民间企业和大学的专家合作，系统总结了设计中的质量管理和人工智能系统的开发。机器学习质量管理指南》已发布在网络物理安全研究中心网站上。

网址：https://wwwcpsecaistgojp/achievements/aiqm/

质量管理对于安全可靠地管理 IT 系统至关重要，但由于使用机器学习的 AI 系统是通过使用训练数据学习间接构建的，而不是依赖于开发人员明确的程序指令，因此质量管理比一般软件困难得多。本指南适用人工智能系统生命周期涉及全面质量管理，系统总结了满足提供人工智能系统服务所需的质量要求所需的努力和检查项目。为了促进参与开发的各方之间就质量问题进行沟通，该指南规定了使用人工智能系统时所需的质量要求(1)风险规避、（2）人工智能性能、（3）公平三外部质量9122_9187 内在品质期望人工智能系统的开发者和用户能够就系统所需的质量要求达成一致，消除质量不透明，加速人工智能系统的商业利用。

电子及制造领域最新研究成果汇总图

机器学习质量管理指南

指南制定的社会背景

使用机器学习的人工智能系统通过使用训练数据进行学习来间接获取功能，而不是通过开发人员通过程序直接发出指令。因此，即使检查作为开发产品的软件程序的文本，也不可能检查是否已经实现了期望的功能和质量。这使得人工智能系统的质量管理比通用软件的质量管理要困难得多。未来，为了让人工智能系统在各种应用中发挥价值，例如自动驾驶、机器人控制等需要安全确认的领域，以及个人贷款的信用管理等需要公平性的领域，质量管理至关重要，让人工智能系统可以安心使用。近年来，除了日本内阁府“综合创新战略推进委员会”决定的“以人为中心的人工智能社会原则”外，OECD、欧盟等海外多个组织也就人工智能技术的社会接受度提出了建议，并迫使从事人工智能系统开发和使用业务的企业做出回应。此外，为了将人工智能系统和人工智能组件作为供应链中各种系统的一部分进行整合和利用，必须有一个框架来定义参与人工智能系统开发的人员并就质量达成一致。

目前人工智能系统的质量还没有量化的评估标准，因此在订单等交互过程中往往需要时间沟通来确认系统需求，从这个角度来看，也需要一个全面的质量管理体系。然而，对于人工智能系统质量要求的定义，或者检查人工智能系统是否满足要求的特征和方法，目前还没有系统、全面地编制整个系统生命周期的标准或规范。从事人工智能系统开发和使用的企业需要向社会说明整个人工智能系统建设过程中的质量管理和质量管理的成果，因此制定这样的指南是值得期待的。

在技术发展方面，许多AI系统的性能评估技术已经被开发出来并在研究会议等上展示人工智能产品质量保证联盟《人工智能产品质量保证指南》总结了如何应用此类性能评估技术以及确保每个应用示例质量的注意事项。此次发布的指南充分考虑了此类技术发展的成果，整理了实际人工智能系统开发场所应采取的人工智能质量管理方向。

指南制定的背景

本指南作为国家研究开发机构新能源产业技术综合开发机构 (NEDO) 的合同项目于 2018 年进行了研究。¹，“与人一起进化的下一代人工智能技术开发项目/建立现实世界中可靠的人工智能评估和管理方法/研究开发机器学习系统的质量评估指标和测量测试平台”，于2020年过渡，由AIST与来自企业、大学、国家研究机构等的专家委员会共同组织。机器学习质量管理审核委员会'' 以AIST起草的草案为基础，经过审查委员会两年的讨论和审查，制定了第一版指南。

¹　从2018财年到2019财年，该指南是在“下一代人工智能/机器人核心技术开发/全球研发领域/机器学习AI质量保证的研发”项目下实施的，这些指南是该项目的成果。

指南内容

● 指南的定位

本指南遵循内阁府“综合创新战略促进委员会”的“以人为中心的人工智能社会原则”，并提供了评估人工智能系统质量的框架和方法。该指南为人工智能系统和使用机器学习技术实现的软件组件（机器学习元素）设定了质量标准和目标。目的是帮助使用该指南的企业自行衡量和提高使用人工智能的产品质量，减少人工智能误判造成的事故和经济损失。此外，通过这种方法，所取得的质量可以在参与发展的各方之间共享，质量可以作为一种标准向社会展示。通过这样做，可以明确订单等问题的条件，发现问题，并通过高质量呈现附加价值，从而有助于实现“创造优秀人工智能系统的企业受到更多重视”的健康商业环境。

● 指南概述

使用机器学习的人工智能系统的“质量”

使用 AI 系统时需要“使用质量”
AI 系统中机器学习元素所需的“外部质量”
机器学习元素本身的“内在品质”

本指南根据审核委员会的分析和讨论，确定了机器学习元素特有的三种外部品质：“风险厌恶”、“AI 性能”和“公平”。人工智能系统的使用质量也是基于这三个因素来表达的。

另一方面，对于内部质量，我们分析了机器学习要素的构建过程以及性能恶化的原因。 (4)“数据集的一致性”，(5)“机器学习模型的准确性”，(6)“机器学习模型的稳定性”，(7)“程序的健全性”，(8)“运行质量的可维护性”8 项（图2）。这些内在品质通过过程控制和数值评价具体确认，以达到外部品质的要求。

指南要求的质量管理范围不仅延伸到机器学习要素的开发，还延伸到整个系统生命周期，包括质量需求定义、演示实验、系统开发以及包含机器学习要素的人工智能系统的维护和运行。根据各个AI系统、服务提供商和系统开发商的开发情况（SI 供应商·工程师）之间进行划分，并且这些质量管理要求将得到满足。预计它将用于在订购和外包开发工作时建立共识，并设定验收条件。

本次发布的第一版指南是由独立行政机构日本科学技术振兴机构 (JST) 与机器学习质量管理审查委员会参与实际 AI 业务的公司成员经过两年讨论后制定的，并于 2019 年 12 月制定。它是经过信息技术促进局（IPA）和大学的专家以及产品质量保证联盟主要成员审查后制定的，已完成总体质量评估框架，已达到可在企业应用和评估的阶段。

请注意，这些准则是供主导开发使用人工智能系统的系统和服务的公司根据对业务的影响等独立选择是否采用，并与共同开发者和其他人一起实施的，不具有法律和公共准则的约束力。

图1质量实现总体结构

图 2

图 2 需要关注的内部质量特征

未来计划

未来，基于实际业务中的应用及其反馈，我们将继续开发NEDO项目``与人一起进化的下一代人工智能技术开发项目/建立现实世界中可靠的AI评估和管理方法/研究和开发机器学习系统的质量评估指标和测量测试平台。在这个项目中，我们计划定期修订指南并创建英文指南，创建参考指南作为实际工业应用的具体应用示例，利用这些指南构建支持评估工作的软件开发平台，并开发各种评估技术。此外，在日本，我们的目标是通过在利益相关者之间广泛使用它来进行质量管理，使其成为事实上的标准，同时，我们计划开展国际标准化活动，例如ISO/IEC JTC1/SC42（人工智能）提案。

术语解释

◆机器学习

人工智能是指计算机系统不依赖显式程序指令，自动识别数据模式并做出推断和判断的系统。深度学习也是机器学习的典型例子。[返回来源]

◆AI系统生命周期

不仅指AI分析（数据分析）和实现AI的核心部分的开发，还涉及整个产品使用过程，包括目标AI系统质量要求的定义、演示/初步实验、系统开发、维护/运营等。[返回来源]

◆风险规避、AI性能、公平性

本指南中组织的三个外部质量特征作为 AI 质量管理的目标。这些都是“风险规避”，即预测人类和经济损失，避免因人工智能的误判而造成人类和经济损失； “人工智能性能”，最大化人工智能系统的平均利润，例如提高社会系统的效率和预测需求；和“公平”，防止个人受到不平等待遇。[返回来源]

◆外在品质

影响整个系统的系统组件（此处为使用机器学习的软件部分）的质量。对于传统的软件组件来说，主要的外部质量包括符合规范、安全性和软件运行的效率。[返回来源]

◆内在品质

影响系统外部质量的软件元素的固有特征。对于传统软件组件，内部质量包括程序描述的一致性和简洁性，以及代码审查和模型检查期间发现错误的频率。[返回来源]

◆人工智能产品质量保障联盟

2018年成立了一个联盟，由日本电气通信大学西泰晴教授和日本国立信息学研究所石川冬树副教授牵头，旨在开展产学合作，促进人工智能产品质量保证相关的研究与系统化、应用支持与应用、研发，并启发社会对人工智能产品质量的正确认识。
http://wwwqa4aijp/ [返回来源]

◆机器学习质量管理审核委员会

截至 2020 年 6 月，本审核委员会成员所属组织如下（按字母顺序排列）。 Adsol Nissin Co, Ltd、Cyber Souken Co, Ltd、产业技术综合研究所、国立情报学研究所、信息系统研究会（会长：Shin Nakajima教授）、Techmatrix Co, Ltd、DENSO Co, Ltd、东京理科大学、丰田汽车公司、IBM Japan Co, Ltd、NEC Corporation、Panasonic Corporation、日立制作所、富士通株式会社、富士通研究所、公司[返回来源]

◆8 项（内在品质）

本指南重点关注的内部质量特征是

“需求分析的充分性”，分析和组织系统所需的运动范围，并将其反映在必要的训练数据等范围中
``数据设计的充分性'' - 设计充分反映操作范围内高风险情况的训练数据
“数据集覆盖率”，根据系统所需操作范围内的各种情况的设计，无一例外地准备训练数据
“数据集均匀性”，尽可能均匀地训练，以提高机器学习系统的性能
“机器学习模型准确性”，以确认已对训练数据执行了足够的机器学习
“机器学习模型的稳定性”，即使使用训练数据中没有的新输入，也能确保正确运行
“程序运行状况”以确认机器学习元素作为软件正确运行
“运营绩效的可持续性”，用于监控和确认开发期间实现的质量不会在系统运营期间恶化

，每个项目的目标和需要确认的细节都在指南中进行了描述。[返回来源]

◆SI供应商

根据客户公司的要求，承担从考虑如何解决信息系统问题，到设计、开发和操作系统等所有方面的工作的公司。[返回来源]

联系我们

查询表

mile米乐官方网站 发布机器学习质量管理指南

积分

摘要