牛津通识读本:网络 [13]
社区发现方法的一个有趣应用是对美国政治博客圈的分析。物理学家拉达·阿达米克在民主党人和共和党人的博客间发现了清晰的分隔。其得出的网络结构显示,这两大党的阵营绝少相互关联。此外,民主党的博客比共和党的博客更缺乏凝聚力。例如,在此博客圈的堕胎讨论专区中,反对堕胎的博客比支持堕胎的博客联系更为紧密。因此,在线造势运动更可能在前者的博客中得到传播。另一项研究分析了美国学校中的学生社区特征,借此了解种族是否会塑造社交网络。在种族非常多元和十分同质的学校中,这一因素似乎都是无关紧要的。相反,在种族多样性处于中间值时则能看出隔离特征。在代谢网络中,人们已经发现了与特定功能相对应的社区(碳水化合物代谢,核苷酸与核酸代谢,蛋白质、肽和氨基酸代谢,脂类代谢,芳香族化合物代谢,单碳化合物代谢和辅酶代谢等)。最后,公司股票则在价格相关性的基础上聚类,人们能从中发现与银行、矿业、分销、金融等各业务领域相对应的模块。
将社区定义为“内部联系比外部联系更为紧密”的子图非常普遍,但这种做法并未涵盖某些特定的模块。想想朋友间的电话通信链条,其中第一个呼叫第二个,第二个呼叫第三个,以此类推:根据上述定义,这种链条极有可能不会被归类为社区。另外一个例子则是同行业竞争者的网页:显然,他们并没有动力相互连接,尽管他们明显属于同一社区。此外,真实世界的社区比密集的节点群集复杂得多。多种划分可能同时出现;国籍、社会阶层、性别、工作、政治观念统统都可用来对同一群人进行分类。而且,社区之间可能互相重叠:一个人可能同时从属于多个国籍或隶属关系。最后,嵌套社区也可能存在:例如,地域身份从属于国籍。
尽管过于简化,但图示法仍然能够捕捉到系统的诸多相关特征。若我们仔细查看图,便会发现大量相关信息,而运行的复杂测算越多,便会呈现越多细节。真实世界的网络几乎在任何时候都会偏离其随机对照网络,这意味着其中存在某种嵌入的秩序。同样,所有这些网络都未经过设计:偏离很可能产生于自组织过程。目前,在图的结构中寻找新的规律并揭示其潜在机制是网络科学仍然面临的一些挑战。
第八章 网络中的完美风暴
意外之背景
巴罗科罗拉多岛是巴拿马运河中央的一块热带雨林。当其附近的一条河被筑坝拦截后,该岛便只剩下几处小山顶还显露在水面上。它现已成为一个露天试验场,而试验内容是高速公路、建筑物、田地或矿井替代了原始植被,雨林被分割为若干小块之后的情形。洪水淹没巴罗科罗拉多岛周边数年之后,美洲虎和美洲豹的种群数量都迅速萎缩了。结果,它们的猎物种群数量迅速攀升:现在,一种叫刺鼠的大型啮齿类动物已遍布该岛。这些啮齿动物爱好金合欢的硕大种子,所以,它们的繁盛对金合欢的成功繁殖以及依靠这些种子维生的微生物都构成了巨大难题。随着金合欢种群数量的减少,那些种子较小的植物便取而代之,而以后者为食的动物数量随之增加。生态系统的原初变化便向岛上食物网的各个方向延伸开去。
食物网中的多米诺效应并不罕见。通常,网络一般会为大规模的突发及意外动态提供背景支撑。运输系统中的病原体、电网中的断电、社会系统中的大型冲突或意想不到的合作努力等都证明了:网络似乎是“完美风暴”的理想背景。网络节点代94表交换物质或信息(信息包、能量等)的单独实体(人、计算机、物种、基因……),或者它们也可以表示交换单独实体(货物、旅行者……)的场所(国家、机场……)。在这个非常宽泛的分类中,潜在动态的范围十分广大。为何网络会成为这些动态的天然发生场所?图的结构又会如何影响这些过程?对于这些问题不可能有总体答案,但在许多情况下我们能看到,底层网络的异质结构、非随机组织等特征会对表层发生的所有现象造成重要影响。
故障和攻击
2001年7月18日,一列火车在美国巴尔的摩的地下隧道中脱轨并起火。稍后,美国东海岸几个州的网速就变慢了。大火烧毁了途经隧道的光缆,这些光缆分属于美国最重要的几个互联网服务供应商。结果,这一事故引发了横扫美国大部分地区的多米诺效应。互联网常常面临类似的事故。任何时候总会有一定比例的路由器由于各种原因而一直处于死机状态,而每次类似事故都可能会与巴尔的摩脱轨事故一样严重。然而,这种大范围的破坏还是很少见的。网络似乎会容忍一定数量的长期功能障碍而不会出太多问题。这在一定程度上依赖于替代路径,后者允许网络内部流量绕过故障区域。然而,互联网与多数网络一样并没有太多冗余连接,其密度也并不是很高。考虑到这些特征,我们很自然就能预料到它比较容易发生故障。
尽管互联网似乎相对能够承受一些错误和意外,但精心设计的一次攻击仍能造成严重破坏。2000年2月7日,大量用户登录了雅虎网站,其规模之大令该公司的服务器无法响应这些请,网页于是随之崩溃。在随后的几天里,一系列其他网页(从趣到美国有线电视新闻网络等)也因为同样的原因而崩溃。两个月后,警察发现此类登录乃一名15岁的加拿大黑客所为,其昵称为“黑手党男孩”。他并不需要烧毁任何电缆便能阻塞互联网:其所做之事足以让这些吸引万维网上多数流量的网站崩溃。
跟互联网和万维网的情况一样,大多数真实世界的网络都显示出一种双刃的鲁棒性(robustness)。即便大部分网络遭到破坏,它们仍然能够正常运转,但某些突然的小故障或者有针对性的攻击则可能让它们彻底崩溃。例如,基因突变在整个生命过程中都会自然发生(其中有些甚至能删除细胞中的某些蛋白质),或者也能人为地产生(一项名为基因剔除的基因技术就是如此,它能关闭实验室老鼠一个完整基因的功能)。但是,生物体仍能表现出对诸多突变以及大量基因剔除的极强忍耐力。多数时候,生物体还是会在整体上继续正常工作。另一方面,某些特定的突变却能完全破坏细胞的工作。大脑一直在丢失神经元:一次给任一器官带来压力的经历,比如偶尔的酗酒,就会杀死大量细胞。但宿醉过后,一切又都恢复如初。以帕金森症为例,相当比例的神经元甚至会在病人毫无察觉的情况下消失。但当这一比例超过某一阈值,受损情况便开始变得明显。
在这方面,网络与设计而成的系统十分不同。以飞机为例,一个元件的损坏便足以让整个机器停止运转。为了让它更具复原力,我们必须采取策略,比如复制飞机的某些部件:这能让它几乎100%安全。相比之下,多数并非设计的网络则对广泛的错误表现出自然的复原力,但当特定元素失效,它们便会崩溃。网络能容纳多少错误而不出问题?而导致其崩溃的因素又是什么?为了回答这些问题,科学家通过移除网络节点以观察会发生什么情况的方式来模拟故障。删除一部分节点之后,他们会检查剩余的节点是否仍旧相互关联(即某种巨型连通分量是否仍存在于网络之中)且连接紧密(即节点之间的平均距离是否依旧很小)。为了模拟误差,节点是随机移除的。当在随机图中如此操作时,几次移除就会导致节点间距离迅速增加,图也瓦解为许多不相连部分。在半数节点移除之后,与大多数真实世界网络大小一样的随机图便遭到破坏。另一方面,异质网络(不管是真实网络图还是大小类似的无标度模型图)中经历相同的过程时,其中的巨型连接通量在80%的节点都移除之后仍然存在,而其内部的距离则实际上与最初无异。而当研究者模拟像“黑手党男孩”使用的那样一项针对性攻击时,情况则有所不同。他们一开始移除了网络中最“重要”的节点(枢纽节点)。在这种情况下,两种网络的崩溃速度都比之前快很多。然而,后者更为脆弱:在同质网络中,需要移除大约1/5的枢纽节点才能将其摧毁,而异质网络刚被移除少数枢纽节点,就会发生坍塌。
高度连接的节点似乎在错误和攻击中都发挥着至关重要的作用。它们是暴露在针对性攻击之下的多数异质网络的致命弱点。在这些网络中,枢纽节点主要负责图的整体聚合,移除其中少数枢纽节点便足以将其摧毁。另一方面,枢纽节点也是这些网络在暴露于错误和故障中时的“王牌”:当随机移除节点时,多数时候被选出的节点均为低度数节点,因此,只要枢纽节点保持不变,网络便不会坍塌。考虑到节点度数常常与中介性相关,这种情况就会愈加清晰。高度数节点多数时候都是许多网络路径经过的桥梁。当网络遭到随机破坏,为数不多的枢纽节点很少会受到影响。既然枢纽节点不受影响,它们便提供了必要的连接:许多冗余连接则显得多余;经过枢纽节点的路径会让受损网络的工作区域保持连接状态。在某些低度数节点具备高中介性且扮演桥梁角色(就像某些机场一样)的少数网络中,枢纽节点遭到攻击仍然会导致严重的破坏,但最致命的策略还是攻击最具中心性的节点。
多米诺效应
系统可能会从能够容错的弹性状态突然转向全局性崩溃,这应该引起人们的警醒。根据估计,一定速度的物种灭绝在生态系统中是不可避免的