米乐(中国)官方网站开发人工智能，支持膀胱镜检查诊断，与使用基于图像的模型的专家的诊断相当

-即使学习的内窥镜图像比以前少得多，也能实现很高的诊断准确性。-

作为 NEDO 委托项目“与人类共同进化的下一代人工智能技术开发项目”（以下简称本项目）的一部分，米乐m6官方网站 (AIST) 最近开发了一种支持膀胱内窥镜诊断的人工智能，该人工智能使用基于图像的模型，通过学习少量内窥镜图像来进行高精度诊断。

目前，支持图像诊断的人工智能在医疗领域的发展正在取得进展，但支持图像诊断的人工智能在医疗环境中实际应用的领域有限。特别是对于患者或测试数量较少的疾病，或者罕见病例，很难收集训练数据，从而很难应用人工智能来支持图像诊断。

这次，在使用两种数学公式自动生成的 200 万张图像构建了基于图像的模型后，该基于图像的模型还接受了大约 9,000 张膀胱镜检查图像的训练，这比以前少了很多。因此，我们能够实现诊断准确度（943% 的灵敏度，994% 的特异性），超过 8 名专家在诊断是否存在膀胱镜检查任务中的平均水平仅从图像中判断病变。这一准确度超过了使用 ImageNet-21k 和 ImageNet-1k 时的诊断准确度，这两个数据集是广泛用于图像识别 AI 预训练的数据集。

未来，我们计划开发针对诊断目标区域的基于图像的模型，并将其应用于膀胱镜检查以外难以收集训练数据的医疗领域。

这项技术的详细信息将于 2024 年 7 月 15 日至 7 月 19 日在美国奥兰多举行的第 46 届 IEEE 医学与生物学工程协会国际年会 (EMBC2024) 上公布。

图1 使用基于图像的模型构建支持膀胱镜检查诊断的AI

1。背景

目前在医学领域，通过分析内窥镜图像和X射线等图像来支持诊断图像诊断支持AI^※1的发展正在进步。使用这样的人工智能进行诊断，不仅有望提高疾病的早期发现等诊断准确性，还能减轻医疗专业人员的负担。然而，在实际医疗实践中，利用图像诊断支持人工智能的诊断领域是有限的。为了开发分析图像的人工智能，需要提前学习大量图像和称为训练数据的附带信息。已经商业化的图像诊断支持AI需要使用数万到数十万张训练数据，但对于患者和检查数量较少的疾病和罕见病例，很难收集到如此大量的训练数据。特别是泌尿外科领域的膀胱镜检查所需的检查量比胃肠内镜检查少，即使在同一个内窥镜上应用图像诊断支持AI也极其困难。

为了解决这些问题，NEDO 从 2020 年开始这个项目^※2中，AIST开发了一种使用根据数学公式自动生成的大规模图像数据集来构建AI图像识别模型（训练模型）的方法（2022年6月13日、2023年9月29日NEDO/AIST新闻公告^※3）。由于该方法从数学模型中生成预学习图像和附带信息，因此不存在隐私保护等伦理问题，并且可以在不使用大量真实图像的情况下构建AI模型。这次，我们将该技术应用于膀胱镜图像诊断，开发了图像诊断支持AI，即使内窥镜图像比以前少得多，也能实现高精度诊断。

2。当前结果

(1) 基于图像的膀胱镜诊断模型的开发

考虑到膀胱镜图像中反映的膀胱内壁的特征，由两类具有不同特征的数学公式自动生成的大规模图像数据集预学习^※4设计了一种支持膀胱镜检查诊断的方法基于图像的模型^※5

图 2 显示了实际的膀胱镜图像。 (A)是正常的膀胱粘膜。膀胱癌主要有（B）凸起病灶和（C）扁平病灶。 (B)中，病变部从膀胱内壁立体地隆起，因此与(A)相比，能够清楚地识别病变部的轮廓。另一方面，(C)与(A)相同，没有凹凸，但可以识别粘膜表面的纹理的变化，例如表面的发红和粗糙。在这个项目中，我们关注膀胱镜图像中膀胱粘膜的变化，旨在建立一个能够识别这些特征的基于图像的模型。具体来说，它具有表面纹理的特征分形数据库^※6生成的 100 万张图片具有轮廓形状的特征视觉原子^※7 视觉转换器 (ViT)^※8并建立了基于图像的膀胱镜检查图像模型（图 3）。此外，对于这个基于图像的模型，总共有8812张膀胱镜图像、1259张病变图像和7553张正常图像。额外学习^※9构建了诊断支持 AI 模型 (MixFDSL-2k)。

图2膀胱镜检查图像样本

图3使用生成的图像构建基于图像的模型以及膀胱镜检查诊断支持AI的学习

(2) 使用膀胱镜图像验证诊断性能

该表显示了使用未用于学习的 422 个膀胱镜检查图像（87 个病变，335 个正常图像）验证的比较结果。开发的诊断支持AI模型（MixFDSL-2k）的灵敏度为943%，特异性为994%，准确率为983%。与没有预学习的情况相比（无预学习），该诊断准确率在灵敏度上提高了+161%，在特异性上提高了+93%，在正确答案率上提高了+106%。我们还证实，诊断精度超过了使用 ImageNet-21k 和 ImageNet-1k（广泛用于预训练的数据集）时的诊断精度。此外，同样的 422 张膀胱镜图像由一到八名具有 5 年或以上泌尿外科工作经验的专家一一展示。与 AI 相同的任务^※10经测试，开发的诊断支持AI超过了8人的平均灵敏度、平均特异性、平均准确率，结果与专家相当。

用于学习和验证的膀胱镜图像是筑波大学医院在膀胱镜检查期间收集的图像，并获得筑波大学医院伦理委员会（编号：R01-051）和 AIST 生物伦理委员会（编号：I2019-0204）的批准。为了构建基于图像的模型并额外训练诊断支持人工智能，我们利用 AIST 的人工智能桥接云基础设施 (ABCI)，这是世界上最大的人工智能处理计算基础设施。

表膀胱镜检查图像的诊断准确性比较结果

3。未来计划

我们将通过推广该技术在难以收集训练数据作为通用基础技术的其他医疗领域的使用来展示该技术的实用性。此外，我们还将应用该技术的诊断支持系统商业化，即使在人工智能使用尚未取得进展的医疗领域，也可以提供高精度的人工智能诊断支持，包括膀胱镜检查诊断支持。

这项技术的详细信息将于 2024 年 7 月 15 日至 19 日在美国奥兰多举行的第 46 届 IEEE 医学和生物学工程协会国际年会 (EMBC2024) 上公布。

注释

※1 图像诊断支持AI: 在医疗领域，人工智能用于辅助医生判读放射图像、内窥镜图像等测试图像，防止疏忽和遗漏，减少判读工作量，提高图像判读效率。[返回来源]
※2【本项目: 项目名称：与人共同进化的下一代人工智能技术开发项目
项目期限：2020 财年-2024 财年
业务概览：与人类共同发展的下一代人工智能技术开发项目
https://wwwnedogojp/activities/ZZJP_100176html [返回来源]
※3 2022年6月13日、2023年9月29日NEDO/AIST新闻公告: （参考）NEDO/AIST 新闻稿 2022 年 6 月 13 日“开发不需要收集大量真实图像数据的 AI”
(NEDO) https://wwwnedogojp/news/press/AA5_101548html
(AIST)https://wwwaistgojp/aist_j/press_release/pr2022/pr20220613/pr20220613html
（参考）NEDO/AIST 新闻稿 2023 年 9 月 29 日“从数学公式自动学习图像区域分割 AI，无需真实图像或人工成本”
(NEDO)：https://wwwnedogojp/news/press/AA5_101692html
(AIST)https://wwwaistgojp/aist_j/press_release/pr2023/pr20230929_2/pr20230929_2html [返回来源]
※4 预学习: 机器学习概念，指的是在从目标任务学习数据之前从不同任务学习数据的过程。在这里，我们指的是在学习目标膀胱镜图像之前对使用数学公式生成的大规模图像数据集进行训练。[返回来源]
※5 图像基础模型: 它是一个预训练模型，在大量图像数据集上进行训练，以开发具有高识别性能的图像识别 AI。这里，它是指在利用数学公式生成的大量图像数据集上预先训练的用于医学图像识别的预训练模型。[返回来源]
※6 FractalDB: 它是使用分形几何生成的图像数据库。它具有自相似的特性，即图像中部分和整体的结构递归相似，并且具有能够从相对简单的数学公式构造复杂的图像模式的性质。
Kataoka, H、Okayasu, K、Matsumoto, A、Yamagata, E、Yamada, R、Inoue, N、Nakamura, A 和 Satoh, Y，“没有自然图像的预训练”，Proc。 IEEE/CVF 亚洲计算机视觉会议 (ACCV) (2020)。[返回来源]
※7：视觉原子: 由轮廓图像组成的人工图像数据集，该轮廓图像是使用由参数化原子轨道分量的函数定义的绘图程序由两种类型的正弦波合成的。
Takashima, S、Hayamizu, R、Inoue, N、Kataoka, H 和 Yokota, R，“视觉原子：用正弦波预训练视觉变换器”，Proc。 IEEE/CVF 计算机视觉和模式识别会议 (CVPR)，18579–18588 (2023)。[返回来源]
※8 视觉变压器 (ViT): 这是一种将 Transformer（一种最初为自然语言分析而开发的神经网络）应用于图像识别任务的方法。该方法在图像识别任务中取得了比传统CNN（卷积神经网络）模型更好的效果。[返回来源]
※9 额外学习: 机器学习概念，指的是使先前训练的模型适应新任务和数据的过程。在这里，它指的是重新学习基于图像的模型，该模型是使用膀胱镜检查图像的数据通过数学公式生成的图像进行训练的。[返回来源]
※10 与AI相同的任务: 这是一项随机显示从内窥镜图像中剪下的 422 张静态图像的任务，用户必须仅根据图像中的信息回答是否存在病变的两个选择。在实际的内窥镜检查过程中，医生操作内窥镜并做出全面的诊断，包括图像中反映的膀胱粘膜的外观，以及患者的病历、病史以及膀胱镜检查前后图像的信息。 [返回来源]

联系我们

查询表

米乐(中国)官方网站 开发人工智能，支持膀胱镜检查诊断，与使用基于图像的模型的专家的诊断相当

1。背景

2。当前结果

3。未来计划

注释

相关文章

联系我们

米乐(中国)官方网站开发人工智能，支持膀胱镜检查诊断，与使用基于图像的模型的专家的诊断相当