带来变革的想法必定处于研究的前沿。日本最大的公共研究机构之一 AIST 的官方网络杂志。

什么是生成式人工智能?

什么是生成式人工智能?

2022/10/26

#热门〇〇解说

生成式人工智能

―对“下一代人工智能”的期望―

用科学的眼光来看,
社会关注的真正原因

    30 秒内解释

    什么是生成式人工智能?

    美国 Gartner 公司在其 2022 年“战略技术热门趋势”中选择了“生成式人工智能”作为重点关注的关键词。它被定义为“一种从数据中学习内容或事物并利用其产生全新的、富有创意和现实的输出的机器学习方法”。生成式AI等技术已经进入了传统AI技术未曾覆盖的“AI未探索领域”,目前正引起人们的关注。

    对于人工智能来说,世界一分为二。大量数据构成了“有的世界”和“没有的世界”。到目前为止,人工智能的学习涉及从大量数据中提取特征,并从大量训练数据中学习决策。我们采访了人工智能研究中心副研究主任Masahiro Murakawa,探讨了即使在数据不足的世界中也能发挥作用的“下一代人工智能”的可能性。

    目录

    什么是生成式人工智能

    什么是生成式人工智能?

     Gartner 宣布“生成式人工智能”这一关键词为 2022 年“战略技术的热门趋势”。生成式人工智能被认为是“一种从数据中学习内容和事物,并利用其产生全新的、创造性的、现实的输出的机器学习方法。”它作为“下一代人工智能技术”之一而受到关注,因为它不是一种只能在“拥有大量数据的世界”中使用的技术,而数据驱动的人工智能正在成为一种“下一代人工智能技术”。擅长,而是一种能够进入数据不足领域的技术,比如从少量信息中创造出新的东西。

    下一代人工智能与之前的人工智能有什么区别?

     传统的利用大量数据开发的人工智能所做的就是从大量数据中学习“特征”并做出“预测”。创造高性能人工智能的前提是存在人工智能掌握特征所必需的大量质量足够的数据。

     通过学习互联网上提供的大量图像数据和文本数据,可以提高图像和视频合成(例如 GAN(生成对抗网络))以及使用语言模型(例如 GPT-3(生成预训练变压器 3))的句子合成和生成的性能。

     另外,从2021年左右开始,图像生成领域正在发生堪称“革命”的变化。 DALL・E 2、Imagen、Midjourney 等能够生成与语言指令相匹配的图像的 AI 相继出现。其中最受关注的是 Stable Diffusion,它于 2022 年夏天开源。只需几秒到几分钟就可以创建看起来像是人类费尽心思创建的图像,并且大量 AI 生成的图像现在被发布在社交媒体上。稳定扩散之所以成为一场革命,是因为它以任何人都可以使用的格式提供了从大量数据中学习的模型。然而,这种学习仍然需要“大量数据”。

    另一方面,目前正在研究的人工智能,包括“生成式人工智能”,可以被称为“下一代”还有另一个原因。在现实世界中,还没有所有东西都被转换成数据。在很多情况下,由于没有大量的训练数据,或者创建大量数据的成本非常昂贵,因此获取数据是不切实际的。而且,人类从未经历过的世界,自然是没有数据的。我们正在进行研究,以实现下一代人工智能,即使数据很少或没有数据的问题也能产生结果。

     那么,AI要做的除了“预测”之外,还要做的就是“搜索”和“计划”。这与“思考”类似。下一代人工智能的作用是通过结合人类日常使用的方法来产生结果,例如“获得一个想法”和“假设可能导致答案的步骤。”

    在没有数据的世界中使用人工智能

     有很多世界没有人工智能的数据。首先,没有关于人类从未经历过的现象的数据。例如,在相同条件下难以重复测量的情况下,例如与每100年发生一次的天气现象或少数患者的疾病相关的数据,或者在难以安装传感器的地点进行测量,传统人工智能没有足够的数据来“学习特征并进行预测”。此外,可以说,我们生活在一个几乎没有数据的世界,无论是使用动物的实验,还是从无数组合中寻找具有新功能的材料的实验,以及使用真实社会系统的智慧城市示范实验,数据都难以收集或获取成本昂贵。

     人工智能研究人员认为,即使在没有数据的领域也有必要应用人工智能技术,目前正在尝试各种方法。其中之一就是人工智能,它不仅可以预测,还可以探索和计划。

     为了实现可以称为“下一代人工智能”的人工智能技术,不仅需要基于大量数据来选择可以根据过去的经验判断的最佳方法,而且还需要调动人类所知的所有物理定律和经验规则以及类似现象的过去数据,从可以预测的方法中找到更好的方法和方法。

     如果说现在的人工智能是一个能够从大量过去的数据中返回最接近答案的工具,那么下一代人工智能就有可能成为一个在我们在没有数据的摸索世界中与我们一起思考的伴侣。

    下一代人工智能研究现状

    下一代人工智能需要哪些技术要素

    从技术要素来看,实现下一代人工智能所需的技术要素大致可以分为三个阶段。

     1 测量现实世界
     2对其进行测量和建模(处理并合并成人工智能可以理解的形式)
     3 根据模型优化/计划到最佳(可能)值

     目前,1、DX的浪潮正在席卷工业界,企业的各种活动正在数字化、测量、数据开始收集。如果可以获得数据,下一步就是建模,但实际上,并不总是能够获得足够的数据来进行建模。这里重要的是不仅要在模型中添加数据,还要添加人类知识,并创建一个不会与未知发生太大偏差的模型。在没有数据或数据很少的世界中,创建包含迄今为止已知的“知识”的模型非常重要,例如已知的物理和化学反应定律以及通过模拟获得的信息。

     一旦我们创建了模型,我们就可以进入优化、寻找新事物和规划的阶段。事实上,可以说,对于大规模问题或者具有复杂约束条件的问题,“规划”的技术还没有实现。当人类想要完成一个项目或目标时,他们可以很容易地设定中间目标并按照分步计划进行,但让机器来做这件事却极其困难。然而,我们强烈意识到我们必须解决人工智能研究的这方面问题。

    下一代AI的具体例子①--结合知识自动设计酶

     酶设计是对自然界中发现的酶进行修饰以创造具有更高性能的酶的研究。我将用一个增强某种酶蛋白功能的研究例子来解释这一点。

    假设蛋白质中有多个要突变的位点。由于构成蛋白质的氨基酸有20种,因此在5个位置突变时,20种氨基酸的5次方组合有320万种。实际上不可能仅通过实验来验证所有这些突变模式并找到具有所需功能的酶。因此,有必要了解应该添加什么样的突变。

     在这种情况下,第一个技术要素“测量现实世界”既昂贵又耗时,因此需要减少实验数量。因此,我们使用了通过实际数量的实验获得的仅约80个突变体的实验结果中获得的数据作为训练数据。利用这些数据,我们将创建一个模型,可以根据酶的氨基酸序列预测催化活性和表达水平。这就是第二个技术要素,“建模”。此时,由于数据量较小,我们利用已知的特征来提高预测精度。基于此,贝叶斯优化(一种人工智能技术)被用来寻找最佳变异方法的多个候选者。通过获取以此方式获得的候选突变体的实验数据,并重复建模和优化,我们能够找到高活性突变体的组合。 (AIST 新闻稿 2018/08/31东北大学新闻稿 2021/12/2

     此外,数据表明,可能存在自然界中不存在的高性能蛋白质组合,这有望成为开发新蛋白质的方法。

    下一代AI具体示例②——烟花节人流测量、建模和优化

     随着新冠病毒时代的到来,控制人员的流动和流动,即人员流动,变得越来越重要。然而,为此目的所需的人流分析是传统人工智能难以处理的课题。

     由于目标受众人数众多,不知道路线是否安全,还是只有我一个人需要等待很长时间?还需要考虑个人感受到的不公平感。最重要的是,一遍又一遍地收集和研究数据,同时对旅行路线和导游的位置等进行详细的更改是不现实的。

     例如,一年一度的烟花大会。火车结束后到站的路程可能会出现拥挤,过去也曾因拥挤而发生过事故,但可以通过改变引导方式来改变人流。需要提出一种新的引导方法提案,以缓解拥堵并安全地缩短旅行时间。

     在本研究中,为了测量技术要素之一的“现实世界”,我们将使用摄像机图像和GPS来测量少数人所走路线的移动轨迹数据。接下来是“建模”。我们对人流进行建模并通过模拟进行预测。我们采用数据同化方法来确定最优模型,使得预测模型和实际测量值相互接近。可以说,通过融入人类关于人流的知识,克服了实际可测量数据的缺乏。基于该人工智能模型,我们寻找从烟花表演场地到车站的信号配时控制和路线引导方向的最优解决方案。我认为重要的是不要满足于我们已经提出了使用人工智能技术的解决方案;我们还需要考虑如何以适合现实世界的方式在现场呈现它。

    烟花节会场回家人流控制模拟实验
    (红点为场馆到车站人流拥堵区域,我们将结合测量数据和控制信号的仿真结果等探索人流控制的最佳方法)

    下一代人工智能能否改变社会

     下一代人工智能应用的主题之一是如何将人类习以为常的事物与人类历史上积累的知识体系结合起来。

     人类随意地“想到一个想法并尝试一下”的行为实际上是令人惊奇的。当在人类没有经验的情况下组合大量参数时,我们会选择一种似乎更有可能的模式,或者我们所说的“猜测”。此外,为答案提供方向、预测遥远的未来、设定中间目标都是对人工智能极其高级的要求,也是研究将继续推进的领域。

     仅靠人类无法实现的事情,仅靠人工智能无法实现的事情。我相信我们能够建立一个人类和人工智能可以共同工作、理解这一点并相互利用的社会。

    对本文的反应

    •  

    •  

    •  

    分享这篇文章

    • 与 X 分享
    • 在 Facebook 上分享
    • 在 LINE 上分享

    对于那些对发表的文章、与 AIST 的合作、介绍的技术、研究成果等感兴趣的人

    AIST 杂志中介绍的案例、结果和主题是 AIST 进行的研究和合作成果的一部分。
    如果您对已发表的文章有任何疑问或对 AIST 的研究内容、技术支持、合作等感兴趣,请联系我们
    请随时使用查询表与我们联系。

    国立产业技术综合研究所

    版权所有 © 米乐m6官方网站 (AIST)
    (日本公司编号 7010005005425)。保留所有权利。