2174
需用时 04:20
12
8
TBBT第4季20集:科学传播八卦(附视频)

(文/大卫·萨尔兹保)这是我的第一篇友情博文,来自好朋友克里斯蒂娜。我和克里斯蒂娜从大学第一个星期开始相识,因为我们专业相同。我们是多年的“题友”——物理学家们在20岁时都是这样。自从在加州大学圣巴巴拉分校拿到物理博士学位后,克里斯蒂娜就成为了网络数学专家,专攻在线网络。那时社交网络还没有成为流行。所以当我看见今晚艾米•法拉•福勒提到模因论时,马上打电话找克里斯蒂娜帮忙。现在开始,她将友好地为我们解释本集背后的科学原理。

http://www.guokr.com/gkimage/ao/ly/rz/aolyrz.png

今晚的友情作家:克里斯蒂娜•勒曼教授

艾米:模因论认为八卦就像其他生物一样需求繁殖,并把人类作为宿主。

在本集中,谢耳朵和艾米发现米姆(八卦和其他社交信息)像传染性生物一样繁殖自己,并将人类作为宿主。他们使用了“模因流行病学”的理论在朋友中进行实验,同时用带有刺激、恶性信息和世俗信息的八卦勾引朋友,以检验前者是否传播得更快。

信息在社会群体中会像传染病一样传播。这种类比说明了社会学家对理解许多不同现象的尝试,包括接受新事物、时尚和潮流的传播、口碑效应和社会媒体宣传活动。如果涉及朋友间的社交问题,也就是社交网络,这种类比会变得无比准确。在每一个社会流行“感染”中,个体因为传导性有可能会传染他的网络邻居,而且传导性决定了这次传播的感染性。理解社会流行的关键是找出有影响力的人,预测流行会传播多远,并找出方法增强或阻碍这种发展。广告商和社交媒体顾问都忙于设计“病毒性”市场策略。就像传染病学家会建议人们采取一些手段来减少病毒的传播(例如洗手),如果这些手段无效,就要找出谁最应接种疫苗限制病毒传播(通常是幼儿园老师)。在营销案例中,营销者最感兴趣的是找出收到免费产品或其他奖励后能够制造最大影响力的人。

尽管理论进展很快,但是直到最近,流行病的实证研究仍局限于查看病人病历和尝试追踪他们接触过的人。社会媒体的出现改变了一切。人们加入社交媒体网站(如Twitter、Digg、Flickr、YouTube)寻找感兴趣的内容或是通过在线社交网络联络朋友和志同道合的人。网站曝光了人们的活动轨迹,这给科学家研究个人和团体行为提供了大量珍贵信息。这些数据是很多物理学家实证的。所以,物理学家(包括作家)肆虐了这块土地,这令实践社会科学家十分懊恼。在科学文化战争中,物理学家通常都像谢耳朵一样傲慢,但他有权利这么做,因为他总是正确。

社交媒体网站上的详细数据使我们可以定量研究社会流行动态。我研究的是Digg和Twitter上的信息传播方式。这些网站允许用户添加朋友到它们的社交网络,这样就可以参与他们发起的活动。如果用户进行了投票或是tweet了一篇小故事,那么他就被“感染”,他的网络邻居暴露在“病毒”中。每个邻居都可能被“感染”(通过投票或转发),他们的邻居也会暴露,以此类推。数据能使我们沿着社交连接追踪数据流。我们发现网络上社交流行的表现和传播与疾病传染方式非常不同。与我们的期望相反,绝大部分信息连结增长缓慢,没有达到“流行”的标准。事实上,信息覆盖了不到1%的用户。

有许多因素可以解释这个现象。也许用户把故事的传播限制在很小的范围内防止信息过量;也许网络的结构限制了信息的传播;又或者是社会传播机制使故事无法增长(人们在看到朋友们投票后如何做决定)。我们通过仿真网络上的流行过程和对真实信息连结的实证研究检验了这些假设。

我们发现虽然网络结构在一定程度上限制了信息连结的发展,社交传染机制的一个更戏剧性的效应却吸引了我们的注意。与之前在流行研究中使用的疾病传播模型不同,反复看到同一个故事不能使用户更加倾向于给故事投票。我们定义了一个替代模型观测结果,它再现了在Digg上观测到的真实信息连结特性。

(加长版:我们特别仿真了广泛使用在网络流行研究上的独立连结模型。每个模拟连结把为故事投票的人作为种子节点。类比传染病进程,我们称之为节点感染。种子节点的易感跟随者有一定的概率决定投票,这取决于可传性λ。每个节点可以且仅可以投一票,所以如果种子节点被删除,我们可从新感染的节点重新开始。跟随投票节点的节点并不是独立做出投票的决定。直观上,就是说如果你的朋友们都被感染,那么你感染的几率会变大。)

http://www.guokr.com/gkimage/st/w7/7d/stw77d.png

连结数量是可传性λ的函数,模型是模拟Digg上图片和度分布相同的随机图片的连结过程。Heterogeneous mean field预测了受节点影响的连结数量。 Hmf线说明了这些预测(乘以Digg网中的节点总数)。

不久之后,没有新节点被感染,连结终止。最终受感染的节点数给出了连结数量。这些结果都在上图中显示,其中每个点代表一次连结,y轴给出最终的连结数量、x轴给出了可传性λ。蓝点代表原Digg图的连结数,粉点代表随机Digg图的连结数,金线代表理论预测。在两次仿真中,有一个λ的临界值,流行阈值,在这个值之下的连结会很快停止,而在它之上则会以明显的速度传播。

理论和仿真结果和真实连结的对比造成了问题。为什么连结数如此小?在我们的连结模型中,只有在可传性在接近阈值很窄的范围才会产生合适数量的连结(大约500票)。很明显,此结构不足以解释这种差距。为了更深入地研究,我们检查了传染机制本身。我们发现独立的连接模型严重高估了有两三个朋友投票时当事人投票的可能性。实际上,我们发现,多次看到故事只会轻微增加投票的可能性。

http://www.guokr.com/gkimage/6k/g9/3z/6kg93z.png

仿真和真实Digg图连结的连结数量和假设的可传性。给出了HMF连结数量预测作为参考。

通过使用新传染机制的信息连结仿真,我们发现它们的数值之前小一个数量值,如上图所示。真实Digg连结的数量和模拟的数量相似,我们有自信已经发现了限制信息传播的机制。这些发现强调了信息传播和疾病传播的本质区别:尽管在社会群体中有多次被感染的机会,但是人们不会因为多次看到信息而转变成为传播者。

原文看这里

科技名博微博

博主介绍: 大卫·萨尔兹保(David Saltzberg)是美国加州大学洛杉矶分校的物理、天文学教授。与此同时,他还担当着《生活大爆炸》的科学顾问。剧中Sheldon一伙所说的那些专业术语,全部出自此人之手。在他的博客里又进一步阐释了那些令人挠头的科学小知识。



[版权申明]本文由 David Saltzberg 授权果壳网( guokr.com )发表,转载请注明出处。
The End

发布于2011-04-17, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

我的评论

摇滚驴

电气工程及自动化博士

pic