获奖主题
开创性研发自动理解音乐的信息技术及其应用开发
获奖者
信息与人体工程学领域人类信息交互研究部后藤正孝首席研究员
研究成果总结
信息技术,其中计算机分析并自动理解人类一生听不到的大量音乐,已经作为一种重要的基础技术广泛应用于各种情况,例如音乐搜索和推荐、与音乐相关的展示和制作。获奖者自1992年以来一直致力于实现音乐理解技术的开创性研究,并在世界上第一个成功估计流行音乐的主要元素,如节拍、旋律和旋律,开创了“自动音乐理解”的新领域。这两项估计已成为音乐信息处理领域的重要标准问题,并促成了国际上许多后续研究的产生。
音乐声信号是人类通过混合各种乐器和歌声的数十种声音而产生的复杂声音,在获奖者的研究之前,分析它们并估计主要元素的不适定反问题仍未解决。与当时的声学信号分析不同,声学信号分析是做出不适用于流行音乐的假设,例如预先确定少量声源,获奖者实现了一种基于独特的信号处理和统计估计框架的音乐理解技术,不假设声源的数量。此外,我们还建立了一个可以学术使用的音乐数据库,为整个音乐信息处理领域的发展奠定了基础。
在开展此类开创性基础研究的同时,我们还注重应用研究,以“音乐理解技术如何丰富人们的音乐体验”的独特视角推动研究,取得了一批实用性强、新颖的成果。例如,我们创造了十多个世界首创的“主动音乐聆听界面”(合唱播放、歌词同步显示、音乐搜索等),这离不开音乐理解技术,以及一组互联网服务。我们在与行业合作推动实际应用和示范实验方面拥有丰富的记录,我们的研究成果已经应用于各种产品和数字服务中。
获奖者的广泛研究(包括上述研究)通过媒体处理技术和交互技术的融合实现了新的价值创造和工业应用。其杰出的学术成就和社会影响在国内外享有盛誉,获奖无数。
图 基于音乐理解技术的主动音乐聆听界面、互联网服务、演示实验