2119
需用时 04:14
【论文故事】电脑比朋友更懂你?

荣获2014年奥斯卡最佳原创剧本奖的电影《她》中,描述了这样一个科幻爱情故事:心思细腻而深邃的男主角爱上了他的操作系统。通过分析他的数字记录,他的计算机比其他人(包括他长期的女朋友和最亲密的朋友)能更好地理解他,并对他的想法做出回应。电影中的故事虽发生在2025年,但这是否可能会成为现实呢?

在电影《她》中,主角爱上了他的操作系统OS1。图片来源:blastr.com

最近一项研究显示,计算机模型作出的人格判断的确比熟人(包括朋友、家庭成员、配偶和同事等)的判断更准确。研究论文[1]于1月13日发表在《美国科学院院刊》(PNAS)上。果壳网科学人就此对论文作者,剑桥大学的吴又又以及斯坦福大学的米哈尔·科辛斯基(Michal Kosinski)进行了采访。

电脑和朋友,谁更懂你?

在社会生活中,判断别人的个性是一项非常重要的技能,因为个性是隐藏在人们行为和情绪背后的一个关键驱动因素。人们常通过个性判断来做出决定和计划,比如和谁交朋友、结成伴侣、信任谁、聘用谁或者选谁作总统等等。一开始的判断越准确,后面做出的决定也越正确。

之前人们认为,准确的个性判断来自人类大脑的社会认知技能。但是近来研究表明,计算机模型可以通过人类行为的数字记录,对个性做出准确判断[2-3]。那么,计算机和人类的判断,到底哪个更准确呢?

研究中共收集了86,220名志愿者的信息。志愿者被要求填写有关大五人格模型的个性调查问卷,进而得出了他们在开放性、尽责性、外向性、宜人性和神经质这5个方面的个性特征。

计算机做出的人格判断则是以70,520名志愿者的脸书点赞数据为基础的,而点赞被认为可以有效地预测人的个性和其它心理特征[2]。比如,给某个品牌或者产品点赞可以代表消费者的偏好和购买行为;音乐相关的点赞可以透露音乐品味;点赞的网站则可以代表网页浏览行为。而来自他人的判断则由志愿者的好友完成,他们需要填写由10个项目组成的个性量表。

通过将参与者的自我评定与计算机及他人的判断进行比较,研究人员首先检测了这两种判断的自评-他评一致性(外部判断和自我评定的一致性)。因为自评-他评一致性受人际关系的持续时间和形式的影响很大,因此研究人员又进一步将“他人”分成了不同的小类别,分别为朋友、配偶、家人、同居者和同事。

以计算机为基础的人格判断的准确性(y轴)与点赞数目(x轴)之间的关系。红线显示的是计算机对大五人格判断的平均准确性,他人判断的准确性也在这条红线上标出。因为该样本中个体的平均点赞数为227,由此得到计算机在这个点赞数目下的平均准确性为0.56,这比来自他人判断的平均准确性(0.46)要更高,而与配偶判断的准确性(0.58,这也是最好的他人判断准确性相近。在研究中,可以看到随着点赞数目的增加,计算机的判断准确性也在增加;当点赞数超过500时,可以看到该判断准确性可达0.66。而且,相比于其它个性特征,以点赞为基础的模型对于开放性的判断有着最高准确性。图片来源:研究论文

结果显示,计算机模型仅需要100个点赞数据,其准确性就可以超过他人的平均值(蓝点);和同事、朋友/同居者、家人和配偶的判断相比,计算机模型分别需要10、70、150和300个点赞,就可以在准确性方面超过他们。

为什么点赞可用来判断个性?

研究人员表示,点赞可以代表行为、态度和偏好。比如,有着高开放性的志愿者倾向于给萨尔瓦多·达利(Salvador Dali)、冥想或者TED演讲点赞;而具有高外向性的志愿者则倾向于给派对、史努基(Snookie,真人秀明星)或者舞蹈点赞。

谈到计算机判断比人类判断更准确的原因,吴又又解释说:“原因之一是计算机掌握有大量和人格有关的数据信息;另一个原因则在于计算机能通过模型和算法,非常理性地处理这些信息。相反,人类可能会受到认知偏见的影响,而无法以最好的方式处理这些信息。打个比方,我们的结果显示,喜欢英剧《神秘博士》的人是高度内向的;而对普通人来说,即使你知道你的朋友在看《神秘博士》,你可能也无法得出这个结论。“

通过建立模型分析Facebook上的点赞信息,我们能得到关于一个人人格的很有预测。合理的使用这项技术,将会使更多人受益。图片来源:wordpress.com

吴又又告诉科学人:“这次研究中,我们仅仅检测了大五人格特征。我们认为计算机模型完全有可能在判断其他人格特征方面,也有更好的表现。但是,我并不会说计算机模型就一定会更好,因为对某些特征做出正确判断需要更微妙的线索,而这在数字环境中是没有体现的。我们可以拿情商(EQ) 作为例子说明这一点:对人来说,利用面部表情或者肢体语言等信息来判断他人是否在社交中感到尴尬,或者是否对别人产生了共情是相对容易的;但至少从目前来看,这种信息在数字环境中是很难体现的。”

吴又又表示,该研究最实际的应用包括将该算法应用到有着脸书使用者身上——当然是在他们同意的情况下。这样,就可以绘制出使用者的个性特征图谱,而这个图谱可以进一步在其他方面使用,例如

  1. 市场营销,广告商可以因此提高产品的推荐并对他们的市场信息进行量身定制(比如说,蹦极公司可能要针对那些更愿意尝试新体验的人);
  2. 工作推荐,HR专员能根据人格特征选择合适的求职者(如为会计工作选择有条理的人);
  3. 网上约会,一般来说,性格相似的人更容易成对。

针对计算机个性判断是否存在风险,论文作者之一的科辛斯基告诉我们:“个性判断和其他任何技术一样,在道德上是中立的。就像一把刀,我们可以用它来改善生活,也可以用它来伤害我们自己。当然,我们需要小心行事,因为这项技术涉及的范围很大,很多人能从中受益,或受害。因此,我们应该采取一些政策或者技术,来将风险降到最低。在此,有两个原则可以指导我们:透明和受控。首先,我们需要帮助使用者知道,他们有哪些个人数据正被如何使用及可能被如何使用;其次,我们需要让使用者能够控制他们的数据,并决定这些数据可以被用来做什么。做到这两个方面在技术上并不困难,但是落实它们则需要使用者意识到问题本身的存在——也许还需要加上政策制定者的推动。”(编辑:球藻怪)

PS:这个结论对点赞狂魔可能不适用……

参考文献:

  1. Wu Youyou, Michal Kosinski, and David Stillwell. Computer-based personality judgments are more accurate than those made by humans.PNAS.http://www.pnas.org/cgi/doi/10.1073/pnas.1418680112.
  2. Kosinski M, Stillwell D, Graepel T. Private traits and attributes are predictable from digital records of human behavior.PNAS. 110(15):5802–5805.
  3. Kosinski M, Bachrach Y, Kohli P, Stillwell D, Graepel T. Manifestations of user personality in website choice and behaviour on online social networks. Mach Learn. 95(3):357–380.

文章题图:martinvarsavsky.net

The End

发布于2015-01-12, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

我的评论

Onlyhelen

生物化学和分子生物学博士

pic