公告/发布日期:2025/03/06

米乐m6官方网站 人工智能研究的最新发现,显微化石识别结果

-提高放射虫微化石图像分类模型的准确性-

积分

  • 机器学习领域提出的新模型结构和学习方法在微化石图像分类中的应用
  • 能够以平均86%的速度对众多化石物种进行分类,接近专家水平
  • 可应用于对难以收集大量图像的各种颗粒进行分类

概览图

本研究摘要
*这是对原始论文中的数字的引用或修改。


摘要

米乐m6官方网站(以下简称“AIST”)地质信息研究部研究员光村一英、研究组组长板木拓也、宫川步高级研究员、人工智能研究中心片冈弘雄高级研究员开发了一种模型,可以根据地质地层中所含微化石的图像对放射虫种类进行高精度分类。

微化石是浮游生物和其他生物的遗骸,是地质地层形成环境和时代的重要指标,用于资源勘探和重建过去全球环境等研究。近年来,利用机器学习模型开发了高效的微化石观测技术。然而,根据微化石的种类,可能很难收集足够数量的学习所需的图像(训练数据),这已成为使用机器学习实现高精度观察的瓶颈。另一方面,在计算机视觉研究领域,视觉转换器 (ViT)的新模型结构的学习方法以及由数学公式生成的几何图形 (公式驱动的监督学习,FDSL)之类的新技术不断被提出,并且实现高精度图像识别的技术开发正在取得进展。然而,这些最新发现尚未在微体化石分类等地质研究领域得到充分体现。

在这项研究中,我们将这些新技术应用于微化石的图像分类,发现化石物种的分类准确率平均达到 86%,接近专家的准确率。这一结果表明,即使很难收集大量图像,也可以建立高精度的图像分类模型,这一直是地质领域的挑战。

该技术的详细信息将于 2025 年 3 月 6 日(英国时间)公布。科学报告


发展的社会背景

地质地层分析对于破译人类从未经历过的过去全球变暖的记录以及探索地层中存在的石油和有用金属资源发挥着重要作用。特别是,微化石,即地质构造中存在的浮游生物等生物体的遗骸,已被用于各种调查和研究,作为估计地质构造形成时间和环境的重要线索。使用显微镜观察微化石的详细形状并分析其类型和数量需要专门的知识和技能,以及大量的时间和精力。因此,正在开发利用图像分类(机器学习技术的一种)的高效观察技术。根据研究目的,微化石的分类需要 90% 左右的准确度。然而,收集大量地质地层中很少存在的珍稀物种的图像非常困难,迄今为止开发的图像分类模型的准确率仅为78%。

迄今为止,地质领域的图像识别卷积神经网络 (CNN)的模型已被普遍使用。这些模型中的许多模型先在从互联网等收集的常见图像(动物、建筑物、车辆等)的数据集上进行训练,然后再在所需的数据集上进行训练。预习确实如此。另一方面,近年来在计算机视觉研究领域,提出了一种名为 Vision Transformer 的模型结构,有报道称其在包括图像分类在内的各种任务中表现出比 CNN 模型更高的准确性。此外,即使训练数据有限,高精度图像分类技术的开发也取得了进展,例如 AIST 的公式驱动监督学习 (FDSL) 技术,该技术使用通过数学公式生成的几何图形。这些最新发现尚未在地质研究领域得到充分体现。

 

研究历史

AIST 地质信息研究部一直致力于利用机器学习开发高效的微化石观测技术。AIST 新闻稿 2018 年 12 月 3 日)。此外,人工智能研究中心还表明,使用数学公式(FDSL)生成的几何形状进行预学习可以有效提高机器学习模型的准确性(AIST 新闻公告 2022 年 6 月 13 日)。在这项研究中,我们通过协调各个领域的努力,开发出了高度准确的微化石识别模型。

这项研究得到了日本学术振兴会 (JSPS) 科学研究补助金 (23K13192、24K00748) 的部分支持。

 

研究内容

在这项研究中,我们考虑了一个名为“Radilarians”(图 1)的微化石图像数据集,该数据集已用于各种地质研究。该数据集由 32 个化石物种和大约 50,000 张图像组成,根据物种的不同,图像数量可能有几十个,这使得它成为一个不平衡的数据集。先前的研究*中,使用使用真实图像预训练的CNN模型进行学习,所有物种的平均分类准确度据报告为782%。

图1

图 1 本研究中考虑的放射虫图像示例
*原始论文中的数字被引用或修改。

因此,在本研究中,我们使用 ViT 使用两种类型的数据集开发了图像分类模型 (ExFractalDB-21kRCDB-21k) 进行预训练。结果显示,在使用所有这些新技术的条件下,化石物种的平均分类率可达 86%,接近专家的分类率。在检查每个技术要素时发现,与之前使用 CNN 模型的研究结果相比,使用 ViT 的模型显示出更高的准确性(图 2)。相对而言,CNN 倾向于关注图像的纹理,而 ViT 更倾向于关注轮廓进行分类,并且认为使用 ViT 的模型可能更有效地对微化石进行分类,其中轮廓是重要的识别标准。

此外,在比较使用相同 ViT 的两个模型、使用真实图像的预学习和使用公式生成的几何图形 (FDSL) 的预学习时,考虑到五次试验的变化,我们得到了大致相同的结果。然而,在比较各自的平均值时,使用几何形状预训练的模型具有最高的精度,因此使用几何形状预训练被认为是未来微化石图像自动分类应该重点关注的技术。本研究中进行预学习时没有考虑微化石的形状,但未来通过针对与微化石相似的形状进行预学习,或许可以进一步提高分类模型的准确率。

图2

图 2 本研究中开发的模型的准确性比较
*这是对原始论文中的数字的引用或修改。

此外,当我们检查每个化石物种的图像数量与使用 ViT 预先训练的几何形状模型的分类精度之间的关系时(该模型在本研究中表现出最佳精度),我们发现,即使对于只能收集相对少量图像的物种,该模型也显示出很高的分类精度(图 3)。这被认为是地质领域中难以根据图像类型收集大量图像的问题的有效解决方案。这项研究的结果都表明,主动融入机器学习领域提出的新技术可能会导致人工智能模型在地质领域的更有效使用。

图3

图 3 本研究开发的最准确模型中每个类别的训练数据数量与正确答案率之间的关系
*原始论文中的数字被引用或修改。

未来计划

将来,我们将更详细地研究使用数学公式生成几何图形的方法,以便我们即使从较小的数据集中也可以高精度地对化石物种进行分类。此外,本研究考虑的技术除了微化石之外,还可以应用于火山灰、矿物质和花粉等各种颗粒的识别,并可能在地质领域带来更高精度的图像识别。

 

参考文献

*板木拓也。 (2024)。利用人工智能的微化石自动分类与拣选系统。化石,115, 33-42.

 

论文信息

已出版的杂志:科学报告
论文标题:在分形预训练视觉变换器上对微化石放射虫进行分类
作者:三村一秀、板木卓也、片冈宏胜、宫川步
DOI:101038/s41598-025-90988-z


术语表

视觉转换器 (ViT)
2020年提出的图像识别模型中的新网络结构。[返回来源]
公式驱动的监督学习 (FDSL)
一种利用数学公式生成的几何图形进行预学习的技术。除了节省收集教师数据所需的大量精力外,这种方法的优点是原则上不会出现侵犯隐私和不当标签等伦理问题。
参考:AIST 新闻公告 2022 年 6 月 13 日 [返回来源]
卷积神经网络 (CNN)
长期用于图像识别深度学习模型的网络。众所周知,存在通过关注图像中的局部信息来提取特征的趋势。[返回来源]
预学习
在为特定目的(在本研究中为微化石分类)训练专用模型之前,我们使用大型数据集构建通用机器学习模型。众所周知,这个过程甚至可以从相对较小的数据集中进行学习。[返回参考源]
ExFractalDB-21k、RCDB-21k
由 FDSL 中使用的几何图形组成的图像数据集。不同之处在于,ExFractalDB-21k 由基于分形几何的图像组成,而 RCDB-21k 由基于轮廓形状的图像组成。[返回来源]

相关文章


联系我们

查询表