什么是 AI 代理?
什么是 AI 代理?

2025/09/17
人工智能代理
?
用科学的眼光来看,
社会关注的真正原因
什么是 AI 代理?
AI 代理是一种能够自主获取信息、进行推理并生成行动来解决问题的 AI。基于大规模语言模型和大规模多模态模型的智能能力,它与人类和其他人工智能体合作执行各种“动作”。预计不仅在网络上所谓的网络环境中,而且在网络物理环境中,包括现实世界的物理环境中,将有更多的机会发挥积极作用。
专家们宣布的预测敲响了警钟,警告说,一个拥有大规模语言模型和大规模多模态模型的人工智能社会的到来,其大脑的行为与人类相似,甚至更先进的AGI(通用人工智能)和ASI(人工超级智能)威胁着人类的生存。在人们容易因过高的期望和悲观情绪而感到困惑的时候,我们向处于研发和规划研究项目最前沿的人工智能研究中心(AIRC)和信息与人体工程学研究规划办公室的规划主任 Taku Kōga 询问了 AI 代理的当前定位、挑战和前景。*1
什么是 AI 代理
AI代理的基本概念
人工智能代理是一种基于大型语言模型(LLM)或大型多模态模型(LMM)的智能功能自主获取信息、进行推理并生成行动来解决问题的人工智能。
(「什么是大规模语言模型?」)
“1分析情况”
“2选择必要的手段”
“3灵活行动”
“4改善学习”
为什么人工智能代理受到关注
到目前为止,AI智能体在获取信息时,都存在外部系统标准不同而无法访问,或者获取数据的标准不同而无法匹配的问题。然而,最近,随着模型上下文协议(MCP)的协议的开发和发布,该协议定义了信息分发的程序和规则,公司开始调整其数据和服务以适应 MCP 标准,以便人工智能代理可以利用不同的信息源。随着技术的进步,人工智能代理开始成为现实。
预计利用面积
“AutoGPT”和“Microsoft Copilot”等应用程序可以执行网络搜索、收集信息、生成代码和文档,并根据用户指令进行汇总,帮助简化和自动化工作,甚至跨多个应用程序自动回复电子邮件并添加到日历。可以说,人工智能代理开始用于可以在网络空间完成的业务改进。
尽管尚未实现,但AIST正在重点关注以下四个领域,预计未来将得到利用。
1。协作机器人
一种机器人,可以通过识别人及其周围环境并优化他们的行为来帮助工厂等工作场所的人们。机器人也被称为“物理人工智能”,预计将取代人工智能在物理现实世界中产生的动作,代替人类移动并与人类协作。
2智慧城市
人工智能代理有望在整合和优化包括人在内的复杂城市系统方面发挥积极作用。例如,如果一个孩子在没有红绿灯的人行横道上跑出去,该信息将作为数据发送到附近的汽车,这些汽车将自动避开该孩子。
3生活支持
在家庭中,人工智能代理有望充当“私人管家”,支持人们的日常生活并自动执行家务等任务。家用机器人的研究正在取得进展,它可以根据人的喜好以及冰箱中食材的数量和状况自动选择菜肴,即使要求很模糊,例如“我想吃一些清爽的东西。”
4医疗/保健
日本已进入超老龄化社会,医护人员短缺。人工智能代理也有望解决这个社会问题。预计将用于收集患者数据,提醒患者服药、鼓励患者到医院就诊、提供初步诊断和健康咨询直至医生做出最终决定,并支持患者自我管理。 (AIST 杂志“什么是医疗人工智能?」 )
AI代理技术趋势
利用人工智能代理所需的技术
AI 代理由以下三种机制组成。各项基础技术的研究和开发正在取得进展。
1。环境信息获取技术
一种允许 AI 代理通过传感器、API 等获取环境信息的技术。针对图像、音频、触觉、生命数据和激光雷达等多种信息格式的传感技术的开发正在积极进行。 (AIST 杂志“什么是激光雷达?」「什么是触觉?」「什么是生物功能测量?」)
2调整行为的技巧
感知环境后,AI 代理需要一种机制来处理信息并根据环境调整其行为。它是大脑的重要组成部分,正在进行开发以提高LLM和LMM等基本模型的性能。
3。根据结果更新计划的技术
正在使用两种方法进行开发:“自学习”,其中模型自行评估其输出内容,并通过导入来更新它;以及“附加学习”,其中通过根据要解决的领域提供附加数据来更新现有的通用基本模型。
此外,同时获取、集成和理解多种模态数据的“多模态化”技术,以及协调多个人工智能代理的语句的“编排”技术正在积极开发中。 (AIST 杂志“什么是多模式人工智能?」)
协调多个AI代理的语句的编排技术
需要解决的技术问题
世界各地的各个公司都在致力于发展,情况也在日益进步,但以下是每个公司面临的一些需要解决的典型问题。
1。长期、多步骤任务处理
人工智能代理需要处理多步骤任务,包括获取信息、决定行动和实际采取行动的多个阶段。如果任何一步出现错误,则后续所有步骤都将失败。挑战在于进一步提高基础模型的性能,因为需要提高每一步的准确性并一致地执行任务,并且在某些情况下,需要有技术来一路进行调整,说“我做不到这个,但我可以做到这一点。”
2。与环境实时协作
为了让 AI 代理在真实环境中表现自然,它必须在被告知“我希望你这样做”后立即做出反应。挑战在于顺利链接从物理环境获得的传感器和 API 信息。
3。用户个性化和持续学习
由于 AI 代理会非常接近人,因此有必要保留有关人的偏好和过去行为的信息。此外,你必须不断更新你的信息,说:“上周我做了这个,但这周我做了这个。”挑战是创建一个持续学习和改进的系统,以便这个人能够成为一个熟悉的存在,总是让他们满意。
4。可靠性和安全性的保证
当用户做出无意的操作或判断错误时,重要的是能够理解 AI 代理的意图,而不是被留在黑匣子中而无法理解为什么会做出这样的输出。提高意图理解的准确性和人工智能安全措施是重要的问题。 (AIST 杂志“人工智能有哪些安全风险?」)
5。与多个代理系统合作
当多个 AI 代理为一个用户协同工作时,它们需要通过共享信息和划分角色进行合作,而不是相互争斗。技术挑战包括代理间通信协议、决策共识和知识共享。
6。确保知识的准确性和最新性
如果人工智能代理的知识仍然过时,就会导致错误的决策。我们需要让他们明白,即使他们拥有这些信息,如果这些信息已经过时,他们也不应该反映它。为了应对当前时刻的正确性,实时捕获知识的技术和知识更新的自动化是挑战。
7。缺乏道德和不平衡的价值判断
当人工智能代理与人们密切互动并代表他们做出决策和采取行动时,问题就变成了“这个决定在道德上是否正确?”和“它基于谁的价值观?”需要一种技术来为人工智能代理提供公平性、易用性、可解释性以及文化和社会价值观的对待。
社会问题以及解决这些问题的努力
与人工智能的使用相关的隐私、道德和法律体系方面存在许多问题,世界各地已经开始采取与“人工智能安全”相关的举措,以降低社会风险。英国和美国等国家已成立人工智能安全研究所(AISI),正在收集信息并创建框架。在日本,AISI将于2024年2月成立,是相关省厅、国家研究开发机构等跨部门参与的组织。*2已成立。基于AISI合作协议,AIST正在为人工智能安全评估和管理技术的研发、标准化、指南制定和国际标准化做出贡献。在AIST的支持下,AI质量管理倡议于2024年9月启动,以促进私营企业之间的互助。
AIST 的重点领域和未来前景
基础模型研发
AIST 人工智能研究中心 (AIRC) 专注于开发充当 AI 智能体大脑的基础模型,处于世界前沿。最近,Llama 31 Swallow,一种增强日语能力的大规模语言模型、高性能日语语音基础设施模型“Izanami”和“Kushinada”、基于图像的模型,在医学领域实现高诊断准确性、适用于现实世界中困难任务的机器人模型等已公布。我们的目标是继续创造世界一流的成果。
基于机器人的模型研发方法
人工智能安全研发
为了确保安全,AIST 智能平台研究所 (IPRI) 系统地介绍了开发和运营生成式 AI 系统的公司为实现质量应采取的措施。新一代人工智能质量管理指南”将于 2025 年 5 月发布。此外,一项研究和开发项目旨在开发适当管理和利用生成的 AI 所需的安全评估和管理技术,并制定、标准化和传播安全标准*3正在进行中。
未来愿景和 AIST 的作用
到目前为止,人工智能系统还只是工具,但在未来几年,人工智能代理将成为你身边的伙伴或为你做事的代理人。他们不仅将开始在网络环境中发挥积极作用,而且还将在物理环境中发挥积极作用。除了用户素养之外,对于很多人来说,了解人工智能并能够自由操作它也很重要,所以我们计划致力于人工智能人力资源的培训。此次人力资源开发计划通过探索性前沿人工智能开发以及国内和国际人力资源网络的形成来进行。
此外,预计人工智能安全的重要性在未来将变得更加明显,AIST将致力于包括AGI(通用人工智能)和ASI(人工超级智能)在内的安全技术的开发和国际标准化。
AIST作为一个致力于促进世界最高水平研发成果的创造、传播和利用的组织,将共同推动人工智能前沿发展并确保人工智能安全,支持创建一个让人工智能主体成为可靠合作伙伴的社会。
*1:人工智能研究中心副主任Masahiro Hamasaki、副主任Hidenori Banashi、智能平台研究部副主任Hiroshi Oiwa、协调研究主任Konishi Koichi和组主任Yusuke Kawamoto合作撰写了本文。[返回来源]
*2:关于人工智能安全研究所 (AISI)点击此处。[返回来源]
*3:新能源产业技术综合开发机构(NEDO)AI安全增强的研发」[返回来源]