牛津通识读本:网络 [12]
许多网络的高度集聚性表明存在着其中“每人都是其他每个人的朋友”这样的群体。乍一看,这幅图景似乎与网络的小世界属性相矛盾:网络是否是个“开放”世界,其中每个人之间都仅隔几步之遥?或者说网络就是紧密编织的分离群体的总和?现实中,这两个特性之间并不存在真正的矛盾:通过仔细观察沃茨–斯托加茨模型就能看出这一点。这个模型以一圈节点为开端,每个节点都与其最近和次近的邻点相连,就像遥远的村庄与其邻村交换货物一样。这是个完全集聚的结构,其中,任一村庄的所有商业伙伴也互为商业伙伴。然后,该模型为随机选择的节点开放一些连接:少数村庄开放了前往其他遥远村庄的路径,并将货物带往该处,且拒绝与其邻居做生意。少量路径便足以陡然降低任意两个村庄之间的距离,但另一方面,我们可以认为当地紧密的商业结构已遭到破坏,也即,当地的集聚性下降了。然而,沃茨和斯托加茨发现,集聚性的降低并不像平均距离的减少那般明显。实际上,为了使传递性显著下降,人们必须重连几乎所有节点。此时,网络中仅剩随机连接了,而我们并不会期待随机图中存在高集聚性。此处的关键信息在于,网络(既不是有序网格,也非随机图)可以同时具备高集聚性和较短的平均节点距离这两个特征。
集聚性的另一个有趣之处在于,几乎所有网络中某节点的集聚性都取决于该节点的度数。通常,节点度数越大,集聚系数便越小。低度数节点往往属于彼此连接良好的局部网络。类似地,枢纽节点与众多节点连接,这些节点并不会直接地彼此连接。例如,互联网中低度数的自治网络常常属于高度集聚的区域网络,且经由全国主干网彼此连接。许多网络中都可能出现类似的结构,其中集聚性会随着节点度数的增加而呈下降趋势。
谁是你朋友的朋友的朋友……?
金钱会在一定程度上带来幸福,但周围快乐的人却能给人们带来更多的幸福。根据1984年的一项估计,每年多挣5 000美元会增加2%的幸福感,而社会学家尼古拉斯·克里斯塔基斯和詹姆斯·福勒2008年的一项研究表明,拥有一个快乐的朋友则会提升人们15%的幸福感。两位社会学家调查了来自马萨诸塞州弗雷明汉的超过12 000名居民的主观幸福感。不仅如此,他们还绘制了这些人之间的朋友、配偶或兄弟姐妹关系。通过绘制这个关系网,二人发现,联系紧密的人常常有着类似的感觉:幸福的人往往聚在一起,另一方面,不幸之人亦是如此。克里斯塔基斯和福勒甚至还发现了更多有趣的证据。个人的幸福会受到其非直接相邻的人的幸福程度的影响。两步之外(朋友的朋友)的“幸福效应”约为10%;三步之外(朋友的朋友的朋友)则为约6%。这种效应仅在第四步就消失了。这两位社会学家和其他科学家也在肥胖、吸烟习惯以及口头建议(比如找一个好的钢琴教师或一个好的宠物之家)等方面发现了类似的结果:在所有这些情况下,三度空间之外的影响或信息会对个人起作用。人们在不同社会过程中发现的这个三度空间规则是超二元扩散的一个例子,即超越连接最近邻居的二元关系的扩散现象。在这种情况下,每个节点的度数、其邻点的度数,还有邻点之间的连接都不再重要。影响超越了各节点最近的连接圈。实际上,在许多现象中,这种影响甚至超过了三度空间。例如,高度传染性疾病可形成更长的传染链;类似地,营养物则可扩散至整个食物网。
在这种动力机制中,节点的重要程度取决于通过它的链条数量。为了捕捉这个观点,社会学家林顿·C.弗里曼引入了节点的中介中心性这一概念。取某网络中的所有节点对,数一数关联它们的最短路径数。节点的中介中心性基本上就是穿过该节点之最短路径占所有路径数量的比例。这一比例越高,相关节点的中心性就越高。按照这种测量方式,美第奇家族便是15 86世纪佛罗伦萨家族中最具中心性的一个。在这种情况下,中介中心性便可衡量减缓节点流或扭曲通过链条的可能性,它以这种方式服务于中心节点的利益。一些研究表明,企业在经济网络里的中心性很好地预示了它的创新能力(根据获得的专利数衡量)以及财务业绩。有趣的是,1980年到2005年间,东亚国家在世界贸易网络里的中心性经历了大幅增长,而大多数拉美国家却呈下降趋势。然而,这两个地区的贸易统计显示出类似的模式:宏观经济统计并未很好地追踪二者发展的巨大差异,而基于网络的方法却捕捉到了这一点。根据1965年的一项研究,莫斯科在中世纪便成为俄罗斯中部河流运输网络最具中心性的节点。很可能,这为其未来的重要性打下了基础。
中心节点通常充当桥梁或瓶颈:它们几乎是网络交通中的必经站点。因此之故,中心性乃是对网络节点的负荷的估计,前提是大多数节点之间的连接都经过最短路径(情况并非总是如此,但这是个很好的近似情况)。由于同样的原因,中心节点的损坏(例如,某个中心物种灭绝或某个中央路由器被破坏等)会从根本上影响相关网络的节点连接数。根据想要研究的过程,还可以引入中心性的其他定义。例如,接近中心性计算某节点到其他所有节点之间的距离,而抵达中心性则将网络内所有节点分解为经由一步、两步、三步等不同步数抵达的节点。此外中心性还有一些更为复杂的定义。
许多现实世界网络的中心性特征是它们异质性的深层标志。许多真实世界的网络会表现出异质分布特有的长尾。平均中心性并非对任一节点的有效估计,因为这一量值在平均范围内变化很大:少数节点便是网络中几乎所有最短路径的主要瓶颈,整个中心性较低的节点层级都要经由他们向下。考虑到中心性较高节点的重要性,我们很自然地会问它们是否与网络的枢纽节点相同。很多情况下,事实的确如此。例如,高度连接的自治系统也可作为区域网络的桥梁;多义词因与许多其他语词连接,从而将语言中的不同领域联系在一起。但这并非普遍规律。机场便是一个显著的例外:其中,某些低度数机场具有特别大的中介性。2000年,中心性最高的机场为巴黎机场,它是关联着250多座城市的枢纽节点。中心性次高的机场则为位于阿拉斯加州的偏远的安克雷奇,它是一个仅与40座城市连接的中等大小的机场。其他类似机场也出现在最具中心性的机场名单上。这种异常又该如何解释?阿拉斯加州有许多飞国内航线的机场,但安克雷奇是通往美国其他地方的唯一桥梁,因此,许多航线都穿过该机场。这种异常是局部地区机场密度高,却少有通往国外的航线的结果。
你属于什么群体?
1972年,美国一所大学俱乐部的两名空手道教练发生了激烈的冲突,从而决定将他们的俱乐部一分为二。这件在世界上多数人看来不值一提的小事却成了社会学家韦恩·W.扎卡里眼中的一座金矿。1977年,他发布了一项关于此事的开创性研究,并在其中提出了一个新奇的观点。
1970年,空手道教练希先生要求俱乐部主席约翰·A.提高课程价格,以提供更好的薪酬。而他所得到的只是拒绝。随着时间的推移,整个俱乐部都因此事而产生了分歧,两年后,希先生的支持者们在其领导之下组建了一个新的空手道组织。在此期间,扎卡里搜集了空手道课程、会议、派对以及俱乐部成员的聚会等相关信息,并将那些在俱乐部之外还见面的人定义为好友。这时,他便能为该俱乐部绘制一幅精确的友谊网络图谱了:所得图形的结构明显围绕两位教练而分为两个群体,每个群体里的人都互为好友且与其中一位教练交好,而两个群体的成员之间却很少往来(图11)。当俱乐部一分为二,人们几乎都沿区分两个群体的界线站队。
图11 人类学家韦恩· W.扎卡里研究的空手道俱乐部中的友谊结构能让我们预测到该群体会一分为二
仅仅基于网络结构本身,扎卡里的方法便能够几乎完美地预测俱乐部的分裂。从那时起,研究人员便一直致力于找出能够识别网络中的社区或模块的通用办法。在扎卡里的例子中,这些社区或模块仅通过查看图形便能看出,但在其他复杂得多89的情况中,人们尚未发现通用的解决方案。所有真实世界的网络都在一定程度上显示出模块化特征。很明显,阿拉斯加机场便是机场网络结构中一个特定的模块,其他内部连接良好却与外部没有连接的区域也是如此。食物网也分为若干不同的分部,即那些内部互动更加频繁而与其他物种联系较少的物种群体。社交网络也分为不同的团体:例如,针对青少年的研究表明,他们的行为强烈地受其所属群体的影响。神经网络常被划分为对应特定功能的大区块。基因调控网络则被分为不同的子网络,后者与特定的功能或疾病相关联。度数、相关性、集聚性以及中心性都提供了单个节点及其紧邻的周遭环境和节点在整个网络中的相对地位等信息,但它们并不体现整个图形所分解成的各别结构。
模块的更简单形式是模体,它是少数节点在整个网络中重复出现的连接模式。在食物网中,我们经常会发现某种菱形结构:例如,某种食肉动物捕食两种不同的食草动物,后两者食用同一种植物。另一种常见的模体是三个物种的简单链条:大鱼吃小鱼,小鱼吃虾米。这些模式并非纯粹概率的结果:模体在真实的食物网中出现的频率比在其随机对照网络中高出很多。通常,在大型网络中,人们可以区隔出许多可能为候选模体的由节点和边组成的子集。然而,只有当给定的子图出现在某网络中的频率高于其随机对照图时,该子图才能被认为是相关模体。在万维网中,一个十分常见的例子是二分团:它由两组网站组成,其中一组的所有网站与另一组所有网站之间相互连接。通常,这种模体能够确定一组有着相同兴趣的“粉丝”群体(比如有关漂流的博客),并指向他们的“偶像”(例如漂流杂志的网站等)。调控基因的网络则几乎完全由模体构建。当大肠杆菌处于应激状态时,特定的基因回路会感知到应激状态,并协调某些蛋白质的产生。这些蛋白质联合起来形成鞭毛,这种不断摆动的尾状物能让细菌游走以寻找更好的环境。相同的遗传回路,即协调前馈环还存在于许多其他细菌和一些其他微生物体内。演化似乎已经因为特定模体的最优特性而选择了它们(例如,因为它们能用更少量的所需基因来执行某项功能)。此外,模体机制的明显优点是模体可以组合产生新的功能,而其中某个模体受到破坏也不会影响到别的模体。
模体乃某种小规模、局部的重复性模块。但当人们考虑社区时,他们通常意在发现网络中