1464
需用时 02:55
玩网页游戏,教电脑给音乐分个类

我们能否用一台计算机,自动为歌曲加标签进行分类?加州大学的工程师们告诉我们,这是完全可以的。实验结果4月24日发表于美国国家科学院学报。报告中,研究人员的方法名为游戏机器学习(game-powered machine learning),通过该方法可以让音乐爱好者在互联网上通过简单的关键字搜索,就可以轻松找到他们想要的歌曲,而不是那些点击量多的音乐。

搜索包括音乐在内的特定多媒体内容是个不小的难题。这个研发团队的带头人是加州大学的教授兰克里特(Gert Lanckriet),他希望可以创造出一种基于文本的多媒体搜索引擎,让网络上日益增长的多媒体内容搜索起来更容易。当下的情况是就算人们昼夜不停,毫不疲倦的对歌曲进行手动标记分类,也赶不上网络上传多媒体的速度,要知道Youtube用户每分钟可以上传时长60小时的视频文件。

兰克里特教授的解决方案中,计算机先是用那些已被音乐爱好者标记分类好的样本文件进行学习,标签类别诸如浪漫音乐,爵士乐,萨克斯,或者喜庆音乐等。接着分析这些类别中歌曲的波形,归纳出各自样本间共有的声学模型。最后通过对网络上成千上万的歌曲识别声学模型,实现自动分类。计算机这样的训练方法被称为是机器学习法。兰克里特教授号召音乐爱好者在Facebook的一个名为Herd It的在线网页游戏里(http://apps.facebook.com/herd-it),对音乐样本文件进行标记,所以才有了游戏机器学习法的名称。

Facebook上的Herd It

Facebook上的Herd It

兰克里特教授凭借这一研究项目,获得了MIT2011全球杰出青年创新家奖。他说,未来,这将是一个很有前途的大规模音乐搜索法。

这篇论文里还有另外一个很有意义的发现是,计算机可以利用已学习到的知识,设计出从众多手动决策里提取出最有效训练数据的新游戏。兰克里特教授说,问题在于如果你从参与游戏的用户里提取了很少的数据,那就只能形成一个最初步的机器学习系统,计算机能否用这个最初级版的系统来决定,向用户提出的下一个最有效的问题是什么?就像是一个初生的婴儿,你教会他一些知识后,婴儿会反过来问你更多的问题。举例来说,该系统在识别摇滚音乐模型上非常得心应手,但是识别爵士乐却非常困难,这样的情况下,系统就会提问更多的关于爵士乐的音乐样本,来进行下一步学习。

正是由于结合了人们的音乐知识,和通过机器学习自动标记音乐具有可扩展性,从而有了一个活跃的反馈回路,使得音乐检索成为可能。尽管在这个过程中人们的先验知识必不可少,但在兰克里特的解决方案里,相比于获得的巨大成效来说,手动要付出的努力就显得相对较少了。通过这个活跃的反馈回路,计算机自动创造出一个新的Herd It游戏,来获取系统所需的,用于最有效提高自动标记算法的特定输入数据。这个系统并没有采用当下用的两种音乐分类方法:向音乐理论专家付费分析音乐(在线音乐网站Pandora正式使用此方法),另一种是协同过滤(collaborative filtering),在线书籍和音乐销售商现在用这种方法来将买主过去购买过的,和也购买过类似产品的人进行比较,进而向其推荐产品。

这俩种方法在某种程度上算是颇有效率的,但是向音乐专家付费实在是昂贵,对于网上海量的音乐,这笔费用更是巨额。在线音乐网站Pandora经过12年的积累,乐库中才存有900,000首歌。与此同时,协同过滤只对流行或畅销的书籍和音乐有效。 .

兰克里特相信,在将来,得益于这个巨大的音乐分类数据库,手机传感器可以追踪使用者的活跃度和情绪,并使用此数据来提供个人电台服务,即找出和情绪相对应的音乐,并不间断无重复的播放下去。

要让这类个人手机电台工作起来,手机里就必须储存一个巨大的数据库,包含精确标记好的歌曲,电台将从这些歌曲里挑选合适的。这才是音乐搜索引擎要努力的最终方向。第一步要做的就是将网上的音乐都标记分类好,而不是单单挑选出最热门的音乐。根据兰克里特在论文里说的,游戏机器学习就派上用场了。

“我长期以来所钟爱的只有一样,那就是从早晨就开播的无线电台,它一整天都伴随着我,并随着我的心境变化而变化。通过这我想说的是,用户都不用告诉系统,Hey,现在是下午了,我想听些嘻哈点的音乐,系统已然明了,因为它早就通过手机知道了你的偏好”,兰克里特说。




文章编译自sciencedaily网站: 'Game-Powered Machine Learning' Opens Door to Google for Music

The End

发布于2012-05-14, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

宅大大王

计算机应用技术硕士

pic