前沿 互联网

"赞"一下,也会透露你的网络个人特征

小行踪 发表于  2013-03-12 14:32

你的个性,你在Facebook上“赞”了什么息息相关。 供图:Michal Kosinski

近日,英国剑桥大学心理测验学中心的米哈尔·科辛斯基(Michal Kosinski)和他的两位同事在《美国国家科学院院刊》上发布了一份新的研究论文。该论文证实,人们的许多个人特征——诸如政治倾向、宗教信仰、性别、种族和性倾向——都可以通过他在Facebook上的“赞”(Like)记录进行预测。

在研究中,研究人员开发了一个数学模型,可以根据5.8万位美国Facebook用户的“赞”记录来预测他们的各项特征和偏好。之后,他们将模型的预测结果与这些志愿者的Facebook档案信息以及通过在线测试得出的智力、人格和生活满意度等信息进行了比对,发现这个模型可以非常准确地预测参与者的性别、种族出身和性倾向。其性别预测正确率高达93%,在95%的情况下可以正确识别黑人和白人,并在88%的情况下正确识别出了同性恋和异性恋。同时,该模型还有80%以上的几率对民主党人和共和党人、基督教徒和穆斯林进行正确识别。但是,这个模型在预测恋爱状态、药物滥用以及父母离异状况等方面的准确度较低。

就此,果壳网对该论文第一作者——米哈尔·科辛斯基博士进行了采访。

果壳网:用户会在Facebook上面点很多个“赞”,包括视频、链接、状态、图片等等,你们怎样分配不同类型的“赞”的权重?

米哈尔·科辛斯基 :我们使用的是一个非常简单的机器学习方法,让机器来自动判断哪种“赞”更加重要。在这次研究中,“赞”所扮演的角色与其它的数字记录信息很相似,比如你的浏览日志、搜索记录、购买记录、微博和播放列表。

果壳网:为什么这个模型在预测恋爱状态、药物滥用、幸福感和父母离异状况时的准确度会下降呢?

米哈尔·科辛斯基:事实上,我们一开始非常震惊:我们的模型居然还能预测父母离异和药物滥用这种信息!在恋爱关系和幸福指数预测上准确度较低的原因,可能是因为我们取样的用户“赞”记录覆盖了较长的一段时间,而他们在这段时间内的心情和恋爱状态会有多次变化。

果壳网:这些准确度稍低的预测结果能告诉我们什么呢?有办法提高其准确度吗?

米哈尔·科辛斯基:在父母离异状态的预测方面,尽管准确度不太高(都在60%左右),但这其实是一个有着非常深刻意义的结果,因为我们看到了类似父母离异这样的事情会对人们造成的深远影响。对于社会科学家来说,这意味着网络行为是一个大金矿,它能帮助我们更加了解人类。比方说,与“父母离异”关系最大的几个“赞”关键词是:“对不起,我爱你”、“如果我和你在一起,那么我就只想和你在一起,我不要其他任何人”,这表明这种生活事件会给人们留下永久性的行为痕迹,而且这种痕迹是可以在网络环境中被检测到并进行深入研究的。

如果我们在预测恋爱状态或是幸福感时缩短用户行为的取样时间范围,比如一小段给定时间内的用户网页访问记录或是“赞”记录,而不是用几个月甚至几年的数据,就能将准确度提高。

果壳网:这样的预测模型有怎样的实际应用价值呢?

米哈尔·科辛斯基:这样一个能够预测人们个性和其他个人特征的模型,在精准营销、人力资源管理和人机交互等方面都有着巨大的应用潜力。有了这种预测手段,营销人员就可以利用用户的详细资料进行个性化营销,推荐网站和媒体频道;HR们可以在面试之前从成千上万份简历里筛选出最合适的求职者,这样不仅成本低、全自动而且求职者在其个性和能力评估方面也很难造假;各种计算设备、网站也能够迅速识别用户的个人特征,进行对应的交互调整。

我们可以想象一下,你买了一台新的智能手机,它可以根据对你的预测结果自动调整手机设置;或者一台新车,可以根据你的喜好自动调节引擎。事实上,类似的技术已经有所应用。比如亚马逊那著名的推荐系统,就是根据用户之前的行为来推测你还想要什么东西。

果壳网:这是不是意味着商业公司也能利用类似的模型来预测我们的个人特征了呢?这与个人隐私保护会产生不小的冲突。

米哈尔·科辛斯基:当然不是每个公司或是机构都可以,但这无疑是个大问题。我们的研究说明,一些看上去没什么意义的网络行为记录也会透露出人们的很多高度个人化的特征。也就是说,政府、商业公司,甚至是个人(比如你Facebook上的朋友和你的Twitter粉丝)都可以在未经你同意的情况下利用这些记录发现你的敏感信息。这种隐私暴露的可能性会阻止许多人使用数字科技,削弱个人与机构之间的信任感,甚至是阻碍科技与经济的发展。

但我也希望,这种可能性会促进各大公司与制度的制定者改进现有的技术,给予用户对自身信息的完全掌控权。

果壳网:你们会继续研究这个模型吗?下一步你们准备做些什么?

米哈尔·科辛斯基:当然,我们希望未来能对人们在网络行为上的差异有更好的理解。我们已经证实网络行为与人们的个性、智力和其它特征是有关系的,但仍然可能有一些在传统心理学研究中不被考虑的因素需要我们去添加。也许我们会发现一些新东西,比如只与数字环境有关的个性或是技能?

 

更多内容,请移步果壳网的相关小组

热门评论

  • 2013-03-12 18:20 猫眼看人看失格

    中国很多网民在网上骂人不断,把互联网当成了发泄生活的工具------如果这个模型去分析一个这样的典型的中国网民的ID,得出的结果肯定是这个人性格暴戾,有反社会倾向,轻度人格分裂,轻度性虐待倾向等等,但很可能TA就是一个普通人,内心不一定如同网络一样

    [39] 评论
  • 2013-03-12 14:56 尹词

    果壳准备研究果壳网友的行为了吗?

    [10] 评论
  • 2013-03-12 14:51 八路军

    这种数学模型对于兲朝屁民无效

    [5] 评论

显示所有评论

全部评论(68)
  • 1楼
    2013-03-12 14:51 八路军

    这种数学模型对于兲朝屁民无效

    [5] 评论
  • 2楼
    2013-03-12 14:56 尹词

    果壳准备研究果壳网友的行为了吗?

    [10] 评论
  • 3楼
    2013-03-12 15:12 切了柠檬数年轮
    引用@尹词 的话:果壳准备研究果壳网友的行为了吗?

    +1 性情还是死理性,妹子还是汉子

    [0] 评论
  • 4楼
    2013-03-12 15:20 RHODE

    让我想起那有一个人通过统计一个城市的灯光数据来预测政府的财政(也可能不是,记不清了。)
    数学家+电脑=理论上无所不能

    [2] 评论
  • 5楼
    2013-03-12 15:45 素食者
    引用@RHODE 的话:让我想起那有一个人通过统计一个城市的灯光数据来预测政府的财政(也可能不是,记不清了。)数学家+电脑=理论上无所不能

    通过灯光看到的财政状况,以卫星图上南北韩分界线为极致,那真是一个光明一个黑暗。

    [1] 评论
  • 6楼
    2013-03-12 16:11 柏哲雨 手绘爱好者,手绘小组管理员

    所以我都是喜欢的踩,不喜欢的赞。

    [2] 评论
  • 7楼
    2013-03-12 16:21 8-bit

    阴谋论爱好者在未来的日子又多了一个论点

    [1] 评论
  • 8楼
    2013-03-12 16:33 小小诺

    很好奇“兲”这是什么字?
    难道是具有上下结构的王八?

    [1] 评论
  • 9楼
    2013-03-12 16:35 ZoeyC

    如何收藏

    [0] 评论
  • 10楼
    2013-03-12 18:20 猫眼看人看失格

    中国很多网民在网上骂人不断,把互联网当成了发泄生活的工具------如果这个模型去分析一个这样的典型的中国网民的ID,得出的结果肯定是这个人性格暴戾,有反社会倾向,轻度人格分裂,轻度性虐待倾向等等,但很可能TA就是一个普通人,内心不一定如同网络一样

    [39] 评论
  • 11楼
    2013-03-12 19:25 一无知小学生
    引用@猫眼看人看失格 的话:中国很多网民在网上骂人不断,把互联网当成了发泄生活的工具------如果这个模型去分析一个这样的典型的中国网民的ID,得出的结果肯定是这个人性格暴戾,有反社会倾向,轻度人格分裂,轻度性虐待倾向等等,但很可能TA就是一个普通人,内心不一定如同网络一样

    带感~得出的结果之所以不符合,都是止步于思想,而不敢做的..网络巨人愤青,生活普通常人..很多扇风点火的微博图文,能引起大家的强烈愤慨同感..XX铁道局追尾、出轨,XX煤矿爆炸,腐败官员..又城管大队,老人不扶,小孩被拐..所以选取可靠的有价值评论信息才准确..

    [1] 评论
  • 12楼
    2013-03-12 19:32 Sheldon 理论物理博士,科学松鼠会成员

    万物至理的链接打开结果是机器学习小组

    [0] 评论
  • 13楼
    2013-03-12 20:17 迷若可

    文章怎么不说下分析的过程

    [0] 评论
  • 14楼
    2013-03-12 20:33 未绪_Tay

    我想说、、、这个“赞”和个人特征当中一定有着直接的因果联系么= = 真的是因为某个人有某些人格特征所以会去点某些“赞”么、、、

    [0] 评论
  • 15楼
  • 16楼
    2013-03-12 21:43 -MSeeker-
    引用@猫眼看人看失格 的话:中国很多网民在网上骂人不断,把互联网当成了发泄生活的工具------如果这个模型去分析一个这样的典型的中国网民的ID,得出的结果肯定是这个人性格暴戾,有反社会倾向,轻度人格分裂,轻度性虐待倾向等等,但很可能TA就是一个普通人,内心不一定如同网络一样

    不一定吧。。。通过“发泄”这一行为推测用户“性格暴戾”应该不是机器学习与AI的做法吧?AI不懂因果,它只关心统计显著性……这也就是为什么机器学习往往能够挖掘出隐藏在层层因果假象下的真实。

    [2] 评论
  • 17楼
    2013-03-12 21:49 等号

    几乎不按顶或赞

    [1] 评论
  • 18楼
    2013-03-12 22:13 青青吃货

    数学家+电脑=理论上无所不能

    [2] 评论
  • 19楼
    2013-03-12 22:14 青青吃货

    这个还有点意思, 蓝蜘蛛007还可以

    [0] 评论
  • 20楼
    2013-03-12 23:46 珺子

    暴露坐标很可怕:)

    [1] 评论
  • 21楼
    2013-03-13 00:20 -Ashram-
    引用@-MSeeker- 的话:不一定吧。。。通过“发泄”这一行为推测用户“性格暴戾”应该不是机器学习与AI的做法吧?AI不懂因果,它只关心统计显著性……这也就是为什么机器学习往往能够挖掘出隐藏在层层因果假象下的真实。


    赞!


    刚想这么说就看到了这条。

    [0] 评论
  • 22楼
    2013-03-13 01:03 Maigo-_- 语言爱好者

    “在88%的情况下正确识别出了同性恋和异性恋”
    这个数字有点低了吧?难道说Facebook上同性恋占了至少12%,以至于全猜异性恋不会达到更高的准确率?

    [1] 评论
  • 23楼
    2013-03-13 06:14 果壳网洗厕所阿姨 城市规划师,手工爱好者

    微博上从不点赞的来给我分析下?ww

    [0] 评论
  • 24楼
    2013-03-13 08:27 卞尼玛

    作为一个点赞狂魔表示很忧桑

    [1] 评论
  • 25楼
    2013-03-13 08:50 scythe7

    楼上两位是被舍弃的小数点

    [0] 评论
  • 26楼
    2013-03-13 08:53 萝卜森
    引用@未绪_Tay 的话:我想说、、、这个“赞”和个人特征当中一定有着直接的因果联系么= = 真的是因为某个人有某些人格特征所以会去点某些“赞”么、、、


    不是所有的人格特征,但是一些很表象的东西,比如宗教信仰,黑人白人,同性恋这些文中说到的。

    个人觉得这些方面属于非此即彼的特征。比如要是有人给我传教我肯定会嗤之以鼻,而有相同信仰的就会赞。SO。。。。

    [0] 评论
  • 27楼
    2013-03-13 09:10 子吾

    人就是一边大叫要保护自己隐私,一边却自己大肆暴露自己的隐私

    [1] 评论
  • 28楼
    2013-03-13 10:46 Dear.Geek

    95%的情况下可以正确识别黑人和白人
    纵观全文只看到这句吸引我眼球的,这可不可以证明不同种族的人确实有不同兴趣和习性呢?

    [0] 评论
  • 29楼
    2013-03-13 11:27 猪了个去 智能科学专业 [0] 评论
  • 30楼
    2013-03-13 12:54 young_witch

    准确度好高~~学心理的人有好工具…

    [0] 评论

显示所有评论

你的评论

登录 发表评论

小行踪
小行踪 伪技术宅+伪文艺青年

作者的其他文章

更多科研事,扫码早知道

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 免责声明 联系我们 移动版 移动应用

©2017果壳网    京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:13691127034