作为 NEDO 委托项目“与人类共同进化的下一代人工智能技术开发项目”(以下简称本项目)的一部分,米乐m6官方网站 (AIST) 最近开发了一种支持膀胱内窥镜诊断的人工智能,该人工智能使用基于图像的模型,通过学习少量内窥镜图像来进行高精度诊断。
目前,支持图像诊断的人工智能在医疗领域的发展正在取得进展,但支持图像诊断的人工智能在医疗环境中实际应用的领域有限。特别是对于患者或测试数量较少的疾病,或者罕见病例,很难收集训练数据,从而很难应用人工智能来支持图像诊断。
这次,在使用两种数学公式自动生成的 200 万张图像构建了基于图像的模型后,该基于图像的模型还接受了大约 9,000 张膀胱镜检查图像的训练,这比以前少了很多。因此,我们能够实现诊断准确度(943% 的灵敏度,994% 的特异性),超过 8 名专家在诊断是否存在膀胱镜检查任务中的平均水平仅从图像中判断病变。这一准确度超过了使用 ImageNet-21k 和 ImageNet-1k 时的诊断准确度,这两个数据集是广泛用于图像识别 AI 预训练的数据集。
未来,我们计划开发针对诊断目标区域的基于图像的模型,并将其应用于膀胱镜检查以外难以收集训练数据的医疗领域。
这项技术的详细信息将于 2024 年 7 月 15 日至 7 月 19 日在美国奥兰多举行的第 46 届 IEEE 医学与生物学工程协会国际年会 (EMBC2024) 上公布。

图1 使用基于图像的模型构建支持膀胱镜检查诊断的AI
目前在医学领域,通过分析内窥镜图像和X射线等图像来支持诊断图像诊断支持AI※1的发展正在进步。使用这样的人工智能进行诊断,不仅有望提高疾病的早期发现等诊断准确性,还能减轻医疗专业人员的负担。然而,在实际医疗实践中,利用图像诊断支持人工智能的诊断领域是有限的。为了开发分析图像的人工智能,需要提前学习大量图像和称为训练数据的附带信息。已经商业化的图像诊断支持AI需要使用数万到数十万张训练数据,但对于患者和检查数量较少的疾病和罕见病例,很难收集到如此大量的训练数据。特别是泌尿外科领域的膀胱镜检查所需的检查量比胃肠内镜检查少,即使在同一个内窥镜上应用图像诊断支持AI也极其困难。
为了解决这些问题,NEDO 从 2020 年开始这个项目※2中,AIST开发了一种使用根据数学公式自动生成的大规模图像数据集来构建AI图像识别模型(训练模型)的方法(2022年6月13日、2023年9月29日NEDO/AIST新闻公告※3)。由于该方法从数学模型中生成预学习图像和附带信息,因此不存在隐私保护等伦理问题,并且可以在不使用大量真实图像的情况下构建AI模型。这次,我们将该技术应用于膀胱镜图像诊断,开发了图像诊断支持AI,即使内窥镜图像比以前少得多,也能实现高精度诊断。
(1) 基于图像的膀胱镜诊断模型的开发
考虑到膀胱镜图像中反映的膀胱内壁的特征,由两类具有不同特征的数学公式自动生成的大规模图像数据集预学习※4设计了一种支持膀胱镜检查诊断的方法基于图像的模型※5
图 2 显示了实际的膀胱镜图像。 (A)是正常的膀胱粘膜。膀胱癌主要有(B)凸起病灶和(C)扁平病灶。 (B)中,病变部从膀胱内壁立体地隆起,因此与(A)相比,能够清楚地识别病变部的轮廓。另一方面,(C)与(A)相同,没有凹凸,但可以识别粘膜表面的纹理的变化,例如表面的发红和粗糙。在这个项目中,我们关注膀胱镜图像中膀胱粘膜的变化,旨在建立一个能够识别这些特征的基于图像的模型。具体来说,它具有表面纹理的特征分形数据库※6生成的 100 万张图片具有轮廓形状的特征视觉原子※7视觉转换器 (ViT)※8并建立了基于图像的膀胱镜检查图像模型(图 3)。此外,对于这个基于图像的模型,总共有8812张膀胱镜图像、1259张病变图像和7553张正常图像。额外学习※9构建了诊断支持 AI 模型 (MixFDSL-2k)。

图2膀胱镜检查图像样本

图3使用生成的图像构建基于图像的模型以及膀胱镜检查诊断支持AI的学习
(2) 使用膀胱镜图像验证诊断性能
该表显示了使用未用于学习的 422 个膀胱镜检查图像(87 个病变,335 个正常图像)验证的比较结果。开发的诊断支持AI模型(MixFDSL-2k)的灵敏度为943%,特异性为994%,准确率为983%。与没有预学习的情况相比(无预学习),该诊断准确率在灵敏度上提高了+161%,在特异性上提高了+93%,在正确答案率上提高了+106%。我们还证实,诊断精度超过了使用 ImageNet-21k 和 ImageNet-1k(广泛用于预训练的数据集)时的诊断精度。此外,同样的 422 张膀胱镜图像由一到八名具有 5 年或以上泌尿外科工作经验的专家一一展示。与 AI 相同的任务※10经测试,开发的诊断支持AI超过了8人的平均灵敏度、平均特异性、平均准确率,结果与专家相当。
用于学习和验证的膀胱镜图像是筑波大学医院在膀胱镜检查期间收集的图像,并获得筑波大学医院伦理委员会(编号:R01-051)和 AIST 生物伦理委员会(编号:I2019-0204)的批准。为了构建基于图像的模型并额外训练诊断支持人工智能,我们利用 AIST 的人工智能桥接云基础设施 (ABCI),这是世界上最大的人工智能处理计算基础设施。
表膀胱镜检查图像的诊断准确性比较结果

我们将通过推广该技术在难以收集训练数据作为通用基础技术的其他医疗领域的使用来展示该技术的实用性。此外,我们还将应用该技术的诊断支持系统商业化,即使在人工智能使用尚未取得进展的医疗领域,也可以提供高精度的人工智能诊断支持,包括膀胱镜检查诊断支持。
这项技术的详细信息将于 2024 年 7 月 15 日至 19 日在美国奥兰多举行的第 46 届 IEEE 医学和生物学工程协会国际年会 (EMBC2024) 上公布。