Deezer的AI可以根据情绪强度归类歌曲
Ayeshanyoga @ 2018.09.26 , 02:00 下午VentureBeat称,Deezer研究员已经研发出了能够将某些歌曲与情绪和强度联系在一起的AI系统,其发布在Arxiv.org新出版的一篇名为《基于深度神经网的音频歌词音乐情绪检测》的论文里。
为了判断一首歌的情绪,该团队考虑了音频信号和歌词。一开始,他们把音频信号投入一种带有重建语言语境模型的神经网络。然后,通过使用一种存储超过100万首当代歌曲的元数据集——音乐推荐数据集( Million Song Dataset MSD),来教它怎样判断一首歌的情绪。再用Last.fm数据集,这个数据集可以分配标识给来自50多万个独一无二标签的轨迹。许多标签都是和情绪相关的,从这些标签中,超过1万4000多个英文单词被赋予两个刻度等级,和一个词是多么的积极、消极、安静、活跃联系在一起,来训练这个AI系统。
MSD只是包含歌曲元数据,而不是歌曲本身,所以该团队用些像歌名、艺术家、专辑名一样的身份标识,将所有信息给Deezer的目录罗列出来。约有60%的结果数据集(18,644条轨迹)用来训练AI,剩下的则用来验证和进一步测试该系统。
人们认为这种系统可以进一步观察音乐、歌词和情绪如何联系。
最后,研究员称,AI相比于更传统的方式,能够更好地检测出歌曲是多么平静和活跃,但当检测歌曲有多么积极或消极时,却和传统方式表现无异。“似乎这次的收获就是我们的模型,尤其在预测“价”时,能够揭晓利用音频和歌词之间的中间联系。”研究员在论文中写道。
论文中也提到过,为了真的借助这个产品,一个带有同步歌词和音频的数据库将会大有帮助。如果这样的数据库存在,那么该团队认为他们可以更精确的判断模糊不定的音轨情绪,因为“某些情况,听众之间会有很大的波动。”(比如人们不会总是觉得一首歌是积极的还是消极的)。最后,研究员认为,这种系统可以进一步研究音乐、歌词和情绪是如何联系的,还有可能区分和发现高音量时未贴标签的数据的深度学习模型。
这与Deezer之前第一次试图用AI区分歌曲来看,相去甚远。去年,Deezer用在Sónar festival的一项挑战回答了这个问题:“用户在家时,我们怎样检测他们是在听歌还是恰好在推荐歌曲呢?”。理论上,在未来学习中,Deezer能够使用这类机器自动地区分和归类歌曲——不仅仅是用艺术家的名字或音乐种类这种基础的元数据,而是一些更细致入微的东西,比如情绪。
本文译自 theverge,由 Ayeshanyoga 编辑发布。
PREV : 理论上我们可以只用单个原子形成化学键
NEXT : 为追求快感,印度瘾君子让毒蛇咬舌头