- 我们将汇集研究机构和大学的智慧,构建大规模语言模型,为世界一流的生成式人工智能奠定基础
- 作为第一步,由国家信息研究所赞助的 LLM-jp 已开始构建专门针对日语的 GPT-3 级大规模语言模型
- 通过构建流程清晰、可以放心使用的大规模语言模型,为增强产业竞争力、解决社会问题做出贡献

AIST、东京工业大学和 LLM-jp(由国立信息研究所赞助)合作研究和开发大规模语言模型
LLM-jp研究小组(由NII、东北大学、东京大学、早稻田大学等组成的LLM研究开发团队)由国立产业技术综合研究所(以下简称“AIST”)、国立大学法人东京工业大学(以下简称“东京工业大学”)、国立大学信息研究所(以下简称“国立情报学研究所”)共同组建。 ``NII'')。人工智能一代世界顶级粉底大规模语言模型的结构(以下简称“法学硕士”)。作为第一步,LLM-jp将生产1750亿份,是传统国内LLM规模的10倍。参数数量建立法学硕士AIST 是构建 LLM 所需的计算资源AI桥接云(以下简称“ABCI”)。此外,为了今后的开发,我们将与东京工业大学和LLM-jp合作,创建开发所需的语言数据。
通过整合 AIST、东京工业大学和 LLM-jp 拥有的与 LLM 建设相关的数据、算法和计算资源利用知识进行研究和开发,我们将创造出有助于增强日本产业竞争力和解决社会问题的成果。
人工智能技术是支撑国家工业的支柱之一,对于高效工作以弥补劳动力下降以及先进利用通过互联网收集的大规模数据至关重要。特别是,LLM(处理语言的人工智能技术要素)的研究正在取得进展。 2022 年交互式人工智能,由美国OpenAI公司发布。它产生流畅对话的能力震惊了世界各地的人们,并且由于其丰富的知识来源和多功能性,人们对它在社会各个方面的使用抱有很高的期望。然而,单纯利用日本以外的公司和研究机构以封闭方式研发的LLM,会使LLM的建设过程变成一个黑匣子。因此,使用LLM时无法消除侵权、信息泄露等担忧。为了活用日语能力较强的LLM,需要构建透明性高、构建过程和使用数据一目了然、可以安心利用的国产LLM。
AIST 一直与国家研究机构和大学合作研究和开发人工智能技术。 AIST和NII于2019年1月18日签署了关于AIST ABCI的利用和人工智能相关研究合作的协作和合作协议。 2023年,我们与NII达成协议,利用ABCI建立法学硕士,致力于构建和管理高质量、大规模的共享数据集。与此同时,AIST 和东京工业大学一直在开展建立法学硕士的研究。
2023年9月,NII申请了ABCI第二期大规模语言模型构建支持计划,参与机构为AIST、东京工业大学和LLM-jp,并入选。大规模语言模型建设支持计划针对日益增长的LLM建设需求,为入选申请者提供最长60天独家使用部分ABCI(高性能计算节点,称为A节点)的机会,以方便需要大规模计算资源的LLM建设。
作为建立世界一流的法学硕士的第一步,LLM-jp 将开始建立一个开放且强大的日语法学硕士。我们这次要构建的LLM规模的参数数量是1750亿,是OpenAI构建的LLM。GPT-3相同AIST将提供ABCI作为构建LLM所需的计算资源。此外,AIST和东京工业大学将与LLM-jp合作,构建LLM开发所需的高质量、大规模共享数据集。
通过这一举措,我们的目标是建立日本第一个公开的 GPT-3 级别日语法学硕士。这使得我们能够使用LLM,其构建过程清晰且高度透明。多模式数据的AI技术的发展,以及生成式AI在机器人上的应用做出贡献。我们还将推进LLM原理的阐明,从而实现可以安心使用LLM的社会生活。
我们将继续利用AIST的计算资源,汇聚日本的智慧进行研究和开发,目标是打造具有世界一流水平的法学硕士。将构建的国产LLM将在使用ABCI以外的计算资源完成模型后通过LLM-jp公开。
国立产业技术综合研究所
信息与人体工程学研究规划办公室
茨城县筑波市梅园 1-1-1 中央办公室,邮编:305-8560
电子邮件:ith-liaison-ml*aistgojp(使用前请将*更改为@。)