牛津通识读本:网络 [10]
巴拉巴西–奥尔贝特模型证明了,自下而上的增长机制能够产生异质性,而不用强加任何自上而下的设计。网络的全局标度不变性是个体及其局部选择的迭代结果:偏向连接更多的节点而不是更少的。这个模型利用概率以使个体在一定程度上可以偏离这种选择行为:一些节点可以决定连接度数低的节点。然而,总体的趋势决定结果。作为进一步的确认,我们可以检查在没有优先连接原则下成长起来的网络是否未出现异质性。的确,新节点会随机地连接到旧节点上,如此一来旧节点的度数并不影响自身吸引新连接的能力。结果出现了同质网络,其中每个节点都有着大致相同的度数。
普遍的机制
优先连接特指网络中的此种机制,而同样的机制还存在于许多自然和社会现象中,这些现象未来的演化取决于它们的历史。例如,城市规模依其目前的大小随时间而改变:大城市会经历较大的扩张,小城市则变化很小。明天的股票价格通常也与今天的价格构成一定的比例关系。这种机制也被称为乘性噪声。这一过程可能会在众多网络中起作用有着各种各样的原因。在某些情况下,具备许多连接是被新节点发现的主要方式。
与许多其他网站连接的网站要比那些连接更少的网站更容易被浏览网页的人发现。高引文献中的情况也是如此。这种增强的受关注程度使得它更容易获得更多连接和引用。
在其他情况下,连接因其自身之故而具有吸引力。社会学家发现了间接择偶这一现象的证据,即人们选择自己的配偶不仅基于相关个体的个人特征,还会考虑他人意见。例如,一项研究发现,同一人在照片中被许多其他女性环绕时,要比其独照能获得处于大学年龄段的女性更高的评价。先前一系列合作伙伴的长名单可能会让一个人处于吸引更多合作伙伴的优势地位。这便是为何优先连接也被称为受欢迎具有吸引力原则的原因。
优先连接产生的一个更加有意的理由是,与枢纽节点相连能够使相关节点更容易接近许多其他节点。自1978年放松管制以来,许多航空公司纷纷采取了枢纽政策,此政策在于选择具备良好连接条件的机场作为它们最偏爱的目的地。动机很明确:由于这些机场与大量目的地相连,与之关联便会吸引更多的潜在客户。类似的事情也发生在连锁董事网络中:任职多个董事会的人可以获取大量信息,并具有广阔视野,这又使他具备很大的吸引力从而被雇用到更多的董事会中。访问在互联网中也至关重要。互联网的大部分由私人企业建立和维护,它们被称为互联网服务提供商。当它们中有一个建立了新的基础设施,其优先考虑之事便是允许用户快速访问网络中储存的信息。考虑到这一点,互联网服务提供商并不会随机选择它们想要连接的路由器,更不会只选择更近的。相反,它们会选择那些能够保证以最少的可能步骤连接到最多服务器的路由器。那么,又有什么比枢纽节点更能实现这一点?在互联网的情况中,绘图计划所提供的数据似乎符合优先连接的假设。数字显示,某一特定时刻发布的地图中带有很多连接的顶点,往往在下一幅图中会有更多连接。
在某些情况下,优先连接会以其他机制的面目出现。设想某人想要创建个人网页。常见的办法是查看朋友的页面,挑选一个不错的用作模板。由于人们常与其朋友有着共同的兴趣,因而新网页很可能会保留模板的大多数链接,或许会改变其中少数。所以,新的页面最终将是模板的副本,变化很少。现在,这种机制掩盖了优先连接的形式。事实上,模板网页会指向什么页面呢?它们很可能会指向枢纽页面。仅仅因为枢纽页面存在并俘获了万维网中的大部分连接,任一给定页面都更可能指向枢纽处,而非那些连接较少的页面。因此,如果某个页面被复制,则每个副本都会为枢纽带来更多的连接,从而形成有效的富者更富过程,优先连接规则因而得到恢复。复制机制看起来奇怪,但实际上它在某些情况下是主导因素。例如,一篇文章中的科学引文通常来自同一领域的其他文章,并往往会巩固该引用文章的权威性。
但复制机制最有趣的一种应用体现在基因网络中。基因组常常通过复制和多样化的过程演化。细胞复制时,所有的DNA都被复制到新细胞中,但有时候也会出错:原始DNA链条的一个完整基因被复制,并在子细胞的基因组中出现两次(复制)。大多数时候,这个新基因只是合成多余的蛋白质,这些多余蛋白质与另外那个相同基因所合成的蛋白质功能相同。然而,在进一步的复制中,两个相同基因中的一个可能会发生突变,从而会使自身合成的蛋白质行使新的生物功能,比如,与之前和自己一样的蛋白质之外的蛋白质发生反应(多样化)。许多情况中都已经发现了这种演化机制。现在,这种机制在蛋白质相互作用网络中的转化完全类似于复制机制:新的节点进入网络(复制和突变的蛋白质),它带来了一些前代的连接(即它最初与之反应的蛋白质),以及由突变而来的一些新蛋白质。高度连接的蛋白质在这种机制中占据天然优势:并非它们更可能被复制,而是它们比那些连接较弱的蛋白质更可能与复制蛋白质相关联,因而更有可能获得新连接。
尽管基因复制的作用仅在蛋白质相互作用的网络中显现,但代谢网络中也存在着支持优先连接的证据(直接或伪装)。这种关联过程的一个明显后果是,枢纽节点通常在网络里的旧节点中产生,因为它们之前有机会从“先发优势”中获益。现在,代谢枢纽正是可能在生命最初演化过程中并入基因组的原始分子,以及RNA(核糖核酸)世界的残余物,比如辅酶A、NAD(烟酰胺腺嘌呤二核苷酸)和GTP(鸟苷三磷酸),或者最原始代谢途径的元素,比如糖酵解和三羧酸循环。在蛋白质相互作用网络的背景下,人们通过跨基因组的比较发现,平均来说,演化上较老的蛋白质与其他蛋白质之间的联系要比较新的蛋白质多。
优先连接并非网络中唯一起作用的机制,也并非所有的异质网络都起源于此。然而,巴拉巴西–奥尔贝特模型还是给出了重要的关键信息。某种简单的局部行为经过多次交互迭代作用,便能产生复杂的结构。这种结构是在没有任何整体设计下产生的,即便我们允许在行为中出现一定程度的随机性,它也会出现,这解释了就整体趋势而言的个体偏差。
适应度起作用之时
当偶然的性关系在紧要关头时,人们往往对潜在性伙伴的某些特征(例如政治观念、社会阶层或是否抽烟等)非常宽容。然而,当考虑订婚或结婚时,这些因素就变得十分重要。这是社会学家爱德华·O.劳曼对90年代中期的数据进行分析之后得到的信息。这些数据表明,美国约有3/4的已婚夫妇都具备大量的相似特征。其中包括,属于同样的社会阶层、种族群体,教育水平相同,甚至具有相近的魅力、政治观点和健康行为,比如饮食和吸烟习惯等。另一方面,当其他类型的性关系出现问题之时,相应的比例会低许多,尽管依旧很高(超过50%)。
同配生殖(即相似个体彼此结合的倾向)甚至在那些婚姻非包办、理论上任何人都能与其他任何人结合的社会中都是很强的趋势。在躁动的大学时代,个人的声望——例如,对此人之前的性伴侣数量进行衡量得出——可以成为塑造性关系网络的相关驱动力。但是,人们安定下来后,更严格的标准便会发生效力。尽管富者更富能在第一种情况中发挥作用,但它几乎无法解释第二种情况。同配生殖是同质相吸的一个具体例子:大量社会学证据表明,它是由相似个体相互关联所构成的一般趋势,也是塑造社交网络的强大力量。在巴拉巴西–奥尔贝特模型中,连接到一个节点的主要标准便是该节点的连接数,但在许多情况下,其他特征对吸引新连接而言重要得多,不管实际的连接数为多少。
巴拉巴西–奥尔贝特动力机制的一个结果是,旧节点相对于新节点而言具备累积优势。然而,实际情况并非总是如此。举个例子,万维网的旧日荣光,比如麦哲伦或Excite等搜索引擎大多已被遗忘。谷歌或雅虎等后来者已取代了前者的位置。累积优势在新的参与者进入游戏时可被完全推翻(想想脸书的情况)。新手往往具备一些固有特征,这让它们比之前的参与者更具吸引力。在这种情况下,网络的连接性并非完全由节点度数驱动,正如巴拉巴西–奥尔贝特模型中所展现的一样。相反,每个节点的某种特殊的特性能够在节点获得连接的能力中发挥十分重要的作用。这种特性被称为节点的适应度,或称为节点的隐变量,它能够塑造网络的结构,却不像连接数那般显而易见。
2002年,物理学家圭多·卡尔达雷利、安德里亚·卡波奇、保罗·德·罗斯·里奥斯以及米格尔·安琪儿·穆诺兹共同设计了一个仅凭节点适应度便可产生网络的模型。其基本思路与随机图相同:在一组节点内,考虑所有可能的配对,再依据某一给定概率看配对节点之间是否能够连接。然而,在这种情况下,概率并不固定,而是依节点在配对中的适应度而改变。模型首先会为节点分配适应度。比如,这个隐变量可能代表了个人的收入。在此情况下,适应度在节点间的分配便会类似于国家的财富分配:先是少数十分富有的节点,然后是一定数量的上层中产阶级节点,之后便是下层中产阶级节点,诸如此类。定义连接的概率是第二步。若要模拟高度隔离的社会,则可建立以下规则:两个人形成社会关系的概率取决于他们收入的差异;具体而言,这种概率与收入差距成反比。也就是说,收入差异越大,两人获得连接的概率便越小。两个收入差别很大的人之间也可能建立联系,但这绝不是社会的主流趋势:一般而言,同质相吸原则将最终胜出。
适应度模型这种机制可能看起来过于简化,但在某些情况下,它能完美地发挥作用:例如,在世界贸易网络中便是如此。在这种情况下,适应度便是世界各国的国内生产总值(GDP)。连接的规则如下:两个国家的适应度越高,它们彼此关联的概率就越大——这将是某种适者更富的机制,其中那些GDP极高的国家会在彼此之间建立更多的商业联系。这种机制与同质相吸原则并不相同,因为,尽管GDP高的国家之间会建立许多联系,但GDP较低的国家并不会与其他低收入国家建立联系:它们的联系仍旧少得可怜。物理学家迭戈·加拉斯凯利和马里耶拉·罗弗雷多于2004年证明,这些组成部分足以精确预测世界贸易网