玩网页游戏，教电脑给音乐分个类| 果壳科技有意思

宅大大王
前沿
电子

1464字
需用时 02:55

玩网页游戏，教电脑给音乐分个类

宅大大王

我们能否用一台计算机，自动为歌曲加标签进行分类？加州大学的工程师们告诉我们，这是完全可以的。实验结果4月24日发表于美国国家科学院学报。报告中，研究人员的方法名为游戏机器学习（game-powered machine learning），通过该方法可以让音乐爱好者在互联网上通过简单的关键字搜索，就可以轻松找到他们想要的歌曲，而不是那些点击量多的音乐。

搜索包括音乐在内的特定多媒体内容是个不小的难题。这个研发团队的带头人是加州大学的教授兰克里特（Gert Lanckriet），他希望可以创造出一种基于文本的多媒体搜索引擎，让网络上日益增长的多媒体内容搜索起来更容易。当下的情况是就算人们昼夜不停，毫不疲倦的对歌曲进行手动标记分类，也赶不上网络上传多媒体的速度，要知道Youtube用户每分钟可以上传时长60小时的视频文件。

兰克里特教授的解决方案中，计算机先是用那些已被音乐爱好者标记分类好的样本文件进行学习，标签类别诸如浪漫音乐，爵士乐，萨克斯，或者喜庆音乐等。接着分析这些类别中歌曲的波形，归纳出各自样本间共有的声学模型。最后通过对网络上成千上万的歌曲识别声学模型，实现自动分类。计算机这样的训练方法被称为是机器学习法。兰克里特教授号召音乐爱好者在Facebook的一个名为Herd It的在线网页游戏里（http://apps.facebook.com/herd-it），对音乐样本文件进行标记，所以才有了游戏机器学习法的名称。

Facebook上的Herd It

兰克里特教授凭借这一研究项目，获得了MIT2011全球杰出青年创新家奖。他说，未来，这将是一个很有前途的大规模音乐搜索法。

这篇论文里还有另外一个很有意义的发现是，计算机可以利用已学习到的知识，设计出从众多手动决策里提取出最有效训练数据的新游戏。兰克里特教授说，问题在于如果你从参与游戏的用户里提取了很少的数据，那就只能形成一个最初步的机器学习系统，计算机能否用这个最初级版的系统来决定，向用户提出的下一个最有效的问题是什么？就像是一个初生的婴儿，你教会他一些知识后，婴儿会反过来问你更多的问题。举例来说，该系统在识别摇滚音乐模型上非常得心应手，但是识别爵士乐却非常困难，这样的情况下，系统就会提问更多的关于爵士乐的音乐样本，来进行下一步学习。

正是由于结合了人们的音乐知识，和通过机器学习自动标记音乐具有可扩展性，从而有了一个活跃的反馈回路，使得音乐检索成为可能。尽管在这个过程中人们的先验知识必不可少，但在兰克里特的解决方案里，相比于获得的巨大成效来说，手动要付出的努力就显得相对较少了。通过这个活跃的反馈回路，计算机自动创造出一个新的Herd It游戏，来获取系统所需的，用于最有效提高自动标记算法的特定输入数据。这个系统并没有采用当下用的两种音乐分类方法：向音乐理论专家付费分析音乐（在线音乐网站Pandora正式使用此方法），另一种是协同过滤（collaborative filtering），在线书籍和音乐销售商现在用这种方法来将买主过去购买过的，和也购买过类似产品的人进行比较，进而向其推荐产品。

这俩种方法在某种程度上算是颇有效率的，但是向音乐专家付费实在是昂贵，对于网上海量的音乐，这笔费用更是巨额。在线音乐网站Pandora经过12年的积累，乐库中才存有900,000首歌。与此同时，协同过滤只对流行或畅销的书籍和音乐有效。 .

兰克里特相信，在将来，得益于这个巨大的音乐分类数据库，手机传感器可以追踪使用者的活跃度和情绪，并使用此数据来提供个人电台服务，即找出和情绪相对应的音乐，并不间断无重复的播放下去。

要让这类个人手机电台工作起来，手机里就必须储存一个巨大的数据库，包含精确标记好的歌曲，电台将从这些歌曲里挑选合适的。这才是音乐搜索引擎要努力的最终方向。第一步要做的就是将网上的音乐都标记分类好，而不是单单挑选出最热门的音乐。根据兰克里特在论文里说的，游戏机器学习就派上用场了。

“我长期以来所钟爱的只有一样，那就是从早晨就开播的无线电台，它一整天都伴随着我，并随着我的心境变化而变化。通过这我想说的是，用户都不用告诉系统，Hey，现在是下午了，我想听些嘻哈点的音乐，系统已然明了，因为它早就通过手机知道了你的偏好”，兰克里特说。

文章编译自sciencedaily网站： 'Game-Powered Machine Learning' Opens Door to Google for Music

The End

发布于2012-05-14，本文版权属于果壳网（guokr.com），禁止转载。如有需要，请联系果壳。

举报这篇文章

宅大大王

计算机应用技术硕士