带来变革的想法必定处于研究的前沿。日本最大的公共研究机构之一 AIST 的官方网络杂志。

通过语音识别将语音信息转化为大数据

通过语音识别将语音信息转化为大数据

2019/07/31

通过语音识别将语音信息转化为大数据 AIST 风险投资将呼叫中心商业化

研究人员的照片
    关键点AIST 在网络上有大量信息搜索音频内容“PodCastle”该系统通过人工智能的使用而发展,使得将语音信息用作大数据成为可能。目前AIST 风险投资商业化除了提高企业呼叫中心运营效率之外,一项运动已经开始将客户反馈宝库用于自己的业务。这项技术可以准确地识别语音并将获得的信息作为大数据使用,具有在其他领域广泛应用的巨大潜力。
    目录

    语音信息可以用作商业大数据!

    三件 2012年,我决定要接受新业务的挑战,于是我从我工作了26年的软件开发公司独立出来。起初,我很难找到自己想做的事情,但2013年去菲律宾实地考察是一个转折点。在那里我看到了令人震惊的景象:一座20多层的高层建筑,每一层都是一个呼叫中心,每层都有数百名接线员排队接听电话。呼叫中心被外包。

     如果你仔细观察,一层楼上有数百名接线员正在记录用户的通话内容。用户反馈是有关市场需求和我们产品问题的信息宝库。该公司收集称为“用户声音”的信息,分析对话内容,并将其用作大数据来发现问题。当时,在日本,呼叫中心被认为是成本高昂、需要大量人员的部门,因此提高效率至关重要。此外,这是一个充满挑战的工作场所,流动率很高,员工经常被投诉者长时间拘留,有时还遭到呵斥。我有一种预感,我在菲律宾看到的制度将来也会在日本采用,我可以把它变成一个商机。

     那么,语音信息转化为大数据这一新业务我们该如何运营呢?有像菲律宾那样的人潮策略,但我认为不仅可以使用基于软件的语音识别技术使呼叫中心运营更加高效,而且还可以将信息本身用作大数据。

    然而,当我在2005年接触到语音识别相关技术时,我的印象是它仍然不是很有用。

    绪方 到2011年左右,语音识别技术已经在手机上实现,并逐渐开始使用。我认为它也被引入呼叫中心,尽管不是很频繁。

    三件是的,在那个时候,我觉得技术已经有了很大的发展。在那里,我通过熟人认识了AIST的人,他告诉我AIST独特的语音识别技术距离实用化又近了一步。后来,我遇到了绪方先生,听了他的解释,我想,“就是这样了!”

    2014 年作为“AIST 技术转让企业”开始

    三件 于是我们向AIST进行了咨询,但发现AIST的技术转让需要很多流程,而且技术使用费也非常昂贵。就在我准备放弃无力承担的资金时,有人告诉我有一个名为“AIST技术转让风险投资”的系统的存在。

     尽管AIST技术转让风险投资系统的成本负担较小,但为了将其商业化,必须解决几个问题。首先,我们需要一个可靠的社会实施商业计划。另一个难题是要求 AIST 研究人员参与内部研究和开发。虽然起初并没有得到绪方先生的良好回应,但我多次访问筑波并邀请他担任技术顾问。

    绪方 我最终决定接受这份工作的原因是因为我认为我可以信任Mimoto先生,也因为我研究语音识别技术已经有10多年了,并创建了一个名为“PodCastle”的系统,这个研究领域对我来说已经取得了突破。我也想将这项技术开发为一项业务,所以我认为时机是正确的。

    语音信息检索系统(PodCastle)概述
    语音信息检索系统(PodCastle)概述

    三件 在绪方先生担任技术顾问的情况下,我们公司于 2014 年秋季作为 AIST 技术转让企业开始了其业务活动。

    绪方 该系统已在网络上被众多用户使用,其在音频数据智能化方面的高性能已得到证实。然而,语音识别技术并不存在完美的形式。语音数据具有多种内容、不同的说话方式以及各种技术术语,并且每天都在创建新单词,因此它必须不断增长才能在该领域发挥作用。

    因此,Mimoto 先生收集了呼叫中心的语音数据来教导机器,并对其进行改进,使其可以在现场使用。我们仍在现场收集数据并继续提高语音识别的准确性。

    此外,我们目前正在开发使用深度学习的语音识别技术,这一点我们一开始并没有实现,并且正在围绕此开发我们的业务。

    从许可业务到解决方案业务

    三件 当然,从一开始就不顺利。我们一开始将该系统授权给公司,但一开始,很少有公司知道如何使用语音识别以及如何提高工作场所效率。目前,通过智能手机和人工智能扬声器的语音输入,人们对语音识别技术的认识正在不断扩大,人们的期望也越来越高。然而,当时实现语音识别的唯一例子是机器人的声音,我认为很难想象它的具体用途。

     在这种情况下,我意识到授权业务很困难,我别无选择,只能创建一个一站式解决方案,提出更具体的用途。因此,我们开发了结合语音识别技术来解决特定客户问题的产品,例如用于金融机构销售支持的客户关系管理解决方案VCRM和呼叫中心定制解决方案VContact。

    绪方 2016年银行采用“VCRM”是飞跃的动力。我和 Mimoto 先生多次拜访了银行,并解释了这项技术的优势和可能性。

    三件 由于我们公司还没有记录,我认为不仅是AIST技术转让企业的称号,而且AIST研究员绪方先生提供的技术解释也给客户带来了很大的安全感。时机恰到好处,社会上正在掀起一股开放式创新的浪潮,企业内部也有积极采用外部技术的氛围,这促使他们采用了VCRM。 Ogata:我们发布了有关在银行引入 VContact 的新闻稿,这促使该提供商决定将 VContact 引入其呼叫中心。

    三件 呼叫中心对话的语音识别并不容易。接线员的麦克风放在嘴边,可以清晰地拾取声音,但通话另一端的人的环境各不相同。通话质量存在差异,并且可能会在后台播放音乐。这会降低语音识别的准确率,所以在引入之前,我们在实际的呼叫中心进行了演示实验,并与客户一起创建了声学模型(影响语音识别系统性能的重要部分),同时对其进行了优化。

    与 AIST 共同发展带来信任

    三本书目前,使用“VContact”时,语音会在通话过程中被识别并转换为文本,并在通话结束时完成内容的转录。通话过程中可以根据通话内容显示相应的常见问题解答,还可以自动创建通话内容摘要,大大提高话务员的工作效率。

    此外,当我遇到问题时,我以前必须使用老板的录音来检查通讯情况,但现在我可以通过短信检查,这节省了我的时间。我们将继续彻底提高呼叫中心的效率,希望未来能够减少30-50%的员工数量。

    此外,我们目前正在应对自动化操作员的挑战。我们希望能够以自然的对话进行响应,例如“您想要哪种颜色?”“它是红色的”或“它是红色的”,而不需要用户进行任何输入。机器要想单独响应电话指令,不仅要正确识别用户的语音并正确响应,还要准确识别用户的姓名、地址、电话号码等,提高准确率还有很多工作要做。

    绪方目前,Hmcomm增加了员工人数,并有多名学生实习生在那里工作。我没想到它在短短几年内增长了这么多。我认为Mimoto先生打开了语音识别服务商业化的大门是一个主要因素。现在,除了AIST的技术外,我们还在开发自己的专有技术。

    三件最近,作为“声音”技术的应用,它已开始应用于畜牧业,通过猪的咳嗽来检测疾病,并通过发声的变化来确定猪何时发情。我们还在熊本设立了基地,我觉得这是一个会持续发展的领域。

     在社会实施方面,将我们的技术与客户的业务相匹配非常重要,我相信客户正是因为AIST的全力配合才对我们公司产生了信任。

     如果您对 AIST 的技术感兴趣并希望将其商业化,我认为最好先咨询我们。我们还为建立企业的法律方面提供支持,这对于个人来说既耗时又昂贵。

    绪方 研究人员有时不知道他们的研究将如何商业化以及它将如何对社会有用。我很高兴三本先生将我所培养的技能发展为一项事业。 AIST拥有许多具有商业潜力的技术,所以如果您有想做的事情,请寻找AIST的技术。

    Hmcomm有限公司
    代表董事兼首席执行官

    三本浩二

    光本浩二

    代表董事兼首席执行官 Koji Mimoto 的照片

    信息/人体工程学领域
    人工智能研究中心
    人工智能应用研究团队
    首席研究员

    绪方淳

    绪方君

    绪方淳的照片

    “将技术带入社会”为什么不在您的业务中利用 AIST 的技术呢?

    日本科学技术协会
    创新推进总部
    创业发展与技术转移中心

    如果您可以将语音信息转换为数据,就可以让很多事情变得更加高效!请随时与我们联系。

    汇商有限公司
    • 东京都港区芝大门 2-11-1 富士大厦 2 楼,邮编 105-0012
    • http://hmcomcojp/

    对本文的反应

    •  

    •  

    •  

    分享这篇文章

    • 与 X 分享
    • 在 Facebook 上分享
    • 在 LINE 上分享

    对于那些对发表的文章、与 AIST 的合作、介绍的技术、研究成果等感兴趣的人

    AIST 杂志中介绍的案例、结果和主题是 AIST 进行的研究和合作成果的一部分。
    如果您对已发表的文章有任何疑问或对 AIST 的研究内容、技术支持、合作等感兴趣,请联系我们
    请随时使用查询表与我们联系。

    国立产业技术综合研究所

    版权所有 © 米乐m6官方网站 (AIST)
    (日本公司编号 7010005005425)。保留所有权利。