Reader's Club

Home Category

牛津通识读本:网络 [9]

By Root 883 0
总体无序的过程所同化。因此,随机图应该成为这些网络的良好模型。这种推理似乎有效,但若深入检验,一些问题便出现了。最明显的是,随机网络根本不是异质结构。相反,它们的度数分布为钟形结构,这表明所有节点都有着大致相同的度数。随机关联节点的过程便是如此,即每个节点最终都有着同样的度数。更确切地说,度数具有特征尺度,且在平均值附近小幅波动。与许多真实的网络相比,随机网络中不存在枢纽节点。

其结果是,随机网络为小世界,而异质网络则是超小世界。也就是说,异质网络顶点间的距离小于其随机对照网络中的相应距离。如果人们在一个随机网络中加入一定数量的枢纽节点(因而使其更具异质结构),则节点之间的距离会变小。相反,如果人们将一个异质网络随机化(即用相同数量的点和边建构一个网络,但让边随机分布),枢纽节点便会消失,节点之间的平均距离也会变大。这表明枢纽节点承担了这些网络中的大多数连接:这些连接中的大部分正是从这些少数的超级连接点中产生的。

更重要的是,随机网络为同质结构这一事实意味着异质并不完全等同于无序。如前述随机网络那般的无序过程并不会产生那些在现实网络中所发现的异质连接。相反,异质性可能恰恰来自其对立面,即来自某种规则的有序行为。

这一点十分令人困惑,因为许多网络都不是设计的结果,也并非是在自上而下的严格监管中发展起来的。像电网或道路网络等少数网络由政治和技术权威控制,但大多数网络则无人监管。例如,互联网由地方一级的网络管理员控制,并且也受到技术、经济和地理特征的限制。然而,其大规模的结构在很大程度上则是未经筹划的:互联网非常类似于一项全球规模的实验,其中没人提出整体结构,而是靠无数代理人的行动将其建立。生物网络是一个更为清晰的例子:它没有设计者,仅有进化提供修补效果。社交网络、政治、金钱、宗教、语言和文化都会对个人之间的关系产生影响,但是当个人关系存在自由空间的时候,这些网络的形成便不再是严格规划的。在所有这些情况下,系统的整体组织产生于其组成部分的集体行为,即某种自下而上的自组织过程。这个过程可以解释为何许多网络即便没有规划,却仍然显示出异质性这样明显的有序标志。

异质性并非网络系统所独有。例如,地震强度便有肥尾状的分布特征,而如果人们绘制出地震频率与其强度的对比图,它便会呈现出很好的幂律分布。“平均强度的地震”并不存在,其中有很大的多变性,从无法察觉的震动到大规模的灾难。另一个例子是城市的规模:其范围从中国最大的大都会到托斯卡纳的小镇不等。还有就是收入分配:20世纪初,经济学家维尔弗雷多·帕累托指出意大利80%的土地掌握在20%的人手中。所有经济体中都存在不同程度的此种不均衡。

所有这些例子与网络共有一个基本特征:它们都是复杂且大体上无监管进程的结果。异质性并不等同于随机性。相反,异质性可能成为某种隐藏有序结构的标志,它并非某种自上而下的计划,而是由系统的所有元素共同作用而产生。这个特征在大范围不同网络中的出现表明,在许多这种网络中,可能有着某种共同的底层机制在起作用。了解这种自组织秩序的起源则是网络科学面临的核心挑战之一。

第六章 网络的涌现


永恒的变化

到20世纪90年代,互联网很大程度上还是一个未知的领域。尽管它已经成为通信、贸易和运输的关键基础设施,但没人清楚地知道其整体架构。管理员控制着本地网络,但他们并不清楚互联网的大规模结构。此外,互联网呈爆炸式增长:从70年代初的几十台机器到上千万台,且增长前景更为广阔。到90年代末,像康柏电脑公司(Compaq)和互联网数据分析合作协会这样的组织启动了一系列绘图计划,旨在探索互联网并描绘其全球布局。康柏公司的计划名为“墨卡托”,以此纪念在16世纪绘制了最为重要的世界地图之一的地理学家,该地图将刚被发现的美洲大陆包含在内——而互联网被认为是一个尚待探索的“新世界”。多亏了这些以及其他项目,互联网地图才得以成为可能,它的增长现已受到监控。

但互联网的动态并未停止:此时此刻,路由器、计算机、电缆和卫星连接都仍在不断被添加或移除,这带来了持续增长的净效应。尽管缺乏规划,但互联网的增长过程也并非完全随机。相反,互联网是一种高度有序和高效的结构。这种涌现的秩序一定是构建网络之个体行为的某种规则性的后果。小规模的机制也必定存在,它们经由大量的交互迭代过程,最终产生了一种在大规模层面井然有序的结构。而解开隐含于网络结构形成过程之下的基本原理,对理解这些网络结构的自组织进程而言至关重要。

甚至那些看起来完全静止的网络,实际上也在进行着某种动态过程。细胞中的基因、蛋白质和代谢物所构成的网络,大脑中的神经网络以及生态系统中的物种网络等等,它们似乎都固定不变:基因调控、代谢途径、神经元连接或猎物–捕食者关系都相对稳定。然而,细胞内的网络在每个个体的发育期间呈爆炸式增长,并且随着生物体的老化及其对环境的应变过程而不断变化。大脑的可塑性在整个生命过程中可能会下降,但它并不会完全消失。物种灭绝或新物种入侵则会彻底重塑食物网。此外,所有生物网络在长期内都会因为自然选择的作用而发生改变。类似的事情还发生在其他明显的静态网络中,例如电网或语言网络。电网建成之后,由于事故和技术发展,它们会慢慢调整自身的形状。语词网络则随着说话者的改变而改变,并且,随着语言整体的演变,新词和新的语义关系也会被引入。

在其他网络中,变化主要集中在连接上,而顶点集合几乎不可改变。例如,某一国家的银行每天都会在银行同业网络中建立不同的借款模式。偶尔,该网络的顶点集合也能发生改变,比如在银行破产或者新的银行出现在市场上之时。然而,这种变化发生在比交易(即边的重新排列)更长的时间段内:在给定的一天中,网络中的变化主要与边相关。类似的事情不仅发生在股票间的价格相关性网络中(相关性的变化比实际的股票组频繁得多),也发生在世界贸易网络中(世界各国经济关系的变化比新的国家通过分离或联合而建立更为普遍),还有机场网络中(不管在哪一年,都仅有少数新机场开张,而大量航线则处于变化之中)。

完全相反的情况则出现在另外一组网络中:在这些图中,新节点被不断添加进来,而这一进程比连线的重新排列重要得多。这种情况最确切的实例是科学论文中的引用网络。引用较早论文的新论文每天都会出现,一旦发表,相应的引用关系便无法再次更改。

最后,在一些网络中,添加(或减少)节点和连线的动力会以相同的速度发生,并让位于一个相当复杂的过程。万维网以创建和删除新网页和新超级链接的方式不断更新。在维基百科这样的特定网站中,每天都会有新文章和文章间的新链接被创建出来。

可能的网络动力的范围十分广泛:网络科学家已经制定了各种衡量标准、数学模型和计算机模拟,以掌握这一过程背后的基本机制,以期理解这些网络的自组织原理。


富者更富

20世纪60年代初,社会学家哈丽雅特·朱克曼采访了一批获得诺贝尔奖的科学家,其目的是找到这些人工作方式中的独特之处,以及他们研究工作成功的秘诀。她在这些诺奖获得者的回答中发现了一个反复出现的主题。一位诺贝尔物理学奖获得者说:“在授予荣誉这件事上这个世界很奇怪。它往往将荣誉给予那些(已经)出名的人。”一位诺贝尔化学奖获得者补充道:“当人们在报纸上看见我的名字,他们往往会记住它,而忽略其他人名。”而一位生理学和医学奖获得者则具体谈道:“[当你在读一篇科学文献时]你常常注意到你熟悉的名字。即便排到最后,它也会让人印象深刻[……]你会记住它,而非长长的著者名单。”“最出名的人会获得更多的声誉,在程度上毫无节制的声誉。”物理学奖获得者如此总结道。

这些观察促使另一位社会学家(朱克曼后来的丈夫)罗伯特·默顿于1968年提出了一个出色的定理。默顿提出,科学处于马太效应这种社会机制的影响之下。这个名字来自《马太福音》:

凡有的,还要加给他,叫他有余;没有的,连他所有的也要夺过来。(《马太福音》,25:29)

依照默顿的观点,这种机制在奖项、资助、关注度、声望等的分配中起着一定的作用。拥有大量此类资产的科学家可以轻松获得更多的类似资产。另一方面,那些缺乏者想要获取或保持这些资产就十分困难。

1976年,物理学家和科学史家德里克·德·索拉·普莱斯发现了支持这种观点的量化证据。普莱斯分析了大量因相互引用而彼此关联的科学文献。他发现,在特定时期内被大量引用的文献往往也会在之后获得更多引用,而那些一开始仅被少量引用的文献后来也未增加多少被引数。普莱斯从数学上证明了这个简单的法则能够解释高引文献(即引用网络的枢纽节点)出现的原因。更确切地说,他证明了这种机制能够解释为何每篇文章的引用数量分布显示出了幂律的肥尾特征。

普莱斯的模型是统计学家乔治·尤德里·尤尔和社会科学家赫伯特·A.西蒙早前开发的数学模型的变体,但是人们直到1999年才明白,这种机制可以解释网络枢纽、异质性、标度不变性在不同网络中整体以肥尾分布出现的原因。该模型的实现归功于物理学家奥尔贝特–拉斯洛·巴拉巴西和雷卡·奥尔贝特。巴拉巴西和奥尔贝特提出了网络增长的数学模型。他们设想了一个始于少量顶点(甚至仅有两三个)随机连接的图形。新的节点以稳定的速度加入到这个原初的核心中,每个节点都带有给定数量的连接。一个简单的规则确定了新节点是如何连接的:新节点会偏好已有许多连接的旧节点。这种机制又称优先连接(图10)。原则上,新节点可以加入任何旧节点之上,但旧节点的度数越高,它吸引新节点的概率便越高。偶尔,连接较少的节点也会接入新的连接,但大多数时候却是枢纽节点更具吸引力。

图10 在网络增长的优先连接机制中,新节点会优先连接度数高的旧节点

这一过程可从数学上加以研究,并能在计算机上进行模拟,人们可以测量真实的网络以确定其是否在起作用。一开始,所有节点多少都具备相同的度数。然而,随着节点的增长,有一些开始累积比其他节点更多的连接。某节点在特定时刻所具备的连接越多,它便越能够吸引新连接。这也是为何优先连接原则又被称为

Return Main Page Previous Page Next Page

®Reader's Club