Reader's Club

Home Category

牛津通识读本:网络 [1]

By Root 873 0
者社会群体等十分不同的系统都用同一种工具来描绘,那就是图(graph),即由多种关联所结成的一种单一的节点架构。这个方法最初由莱昂哈德·欧拉在数学领域发展起来,之后扩展至广泛的学科领域,包括大量使用这种方法的社会学,以及最近的物理学、工程学、计算机科学、生物学和其他诸多学科领域。

使用同一种工具来表现差异显著的不同系统只能以某种高度抽象的方式完成。系统细节描述的缺失在普适形式中得到弥补,即将十分不同的系统视作相同理论结构的不同实现形式而加以考虑。由此观之,计算机病毒的传播可能与流感类似;劫持一个路由器可能与某个物种在生态系统中的灭绝有着相同的影响;而万维网的增长则能与科学文献的增长放在一起比较。

这条推理线索提供了诸多洞见。比如,把系统呈现为图能让我们察觉到那些将明显不相关元素囊括在内的大规模结构。2003年,瑞士电网中的一个小事故触发了一场大规模停电事件,其影响波及1 000公里之外的西西里岛。专注网络结构让我们看到,遥远事物之间最终可能通过难以置信的关系或传播短路径而强烈地关联着。地理和社会上相互隔离的两个个体——比如某个热带雨林中的居民和伦敦金融城中的某位经理——仅通过六度分隔(six degrees of separation)就能相互关联,这个最近的观察与现实相去不远。并且,这种现象可用社会关系的网络结构加以解释。

网络方法还揭示出系统的另一个重要特征,即某些不受外部控制而发展起来的系统仍然能够随机发展出某种内部秩序。细胞或生态系统并非“设计”而成,但仍以某种牢固的方式起作用。类似地,社会群体及社会趋势源于大量不同的压力和动机,但仍然展现出清晰和确定的图景。而互联网和万维网则在缺乏任何监管机构的情况下兴盛起来,并由大量不相关的因素所推动,但它们通常还是按照一致且有效的方式运转。所有这些现象都是自组织过程,即系统内部秩序和组织并非外部干预或整体设计的结果,而是局部机制或倾向在成千上万次相互作用中迭代产生的现象。网络模型能够以清楚和自然的方式描述自组织在诸多系统中是如何产生的。同样,网络让我们能够更好地理解诸如计算机病毒的快速传播、大规模流行病、基础设施的突然崩溃,以及社交恐惧症或音乐流行之爆发等各种动态过程。

在复杂、涌现以及自组织系统的研究领域(即关于复杂性的现代科学)中,网络作为通用的数学框架而变得愈发重要,涉及大量数据时尤其如此。这通常体现于个人在搜索引擎中的累积查询、社交网站的更新、在线支付、信用卡数据、金融交易、移动电话中的GPS(全球定位系统)位置等情况中。在所有这些情形下,网络对于整理和组织这些数据,进而将个人、产品和新闻等相互关联而言是重要的工具。类似地,分子生物学则越来越依赖计算策略以便在其自身产生的大量数据中找到秩序。科学、技术、健康、环境和社会等许多其他领域也是如此。在所有6这些情况中,网络正成为揭示复杂性之隐藏结构的典范。

第二章 富有成效的方法


穿越欧拉之桥

在俄罗斯的加里宁格勒市,一座名为奈佛夫的岛屿坐落于普雷格尔河内。该市300年前曾隶属于普鲁士王国,彼时唤作哥尼斯堡,而奈佛夫岛与该市其余部分则由七座桥相互连接(图2上)。当时的城里流行着一个谜题:是否可能在不重复走过一座桥的情况下,遍历所有七座桥?之前没有任何人成功做到这一点。另一方面,对这种走法的可行性,当时也不存在任何形式证明。而其解决方案来自古往今来最著名的数学家之一。1736年,莱昂哈德·欧拉以一种不寻常的方式画出了哥尼斯堡市的地图。他将陆地和岛屿的部分表示为点,而桥则为连接各点的线(图2下)。

当我们以这种方式看待该问题,事情就变得更加容易了。通过展示城市的网络结构,欧拉证明了谜题中的走法不可能。他的解释基于以下观察:若此种走法可行,则路程沿线所有点的连接数必为偶数。这是因为每当某人通过一座桥进入该市的任何部分时,他必须通过另外一座不同的桥离开。总之,每个区域必须有偶数座桥,比如2座、4座、6座等等。只有起点和终点可以有奇数个连接数:起点只能有一座桥,终点亦复如此。不幸的是,哥尼斯堡地图所有顶点的连接数均为奇数。因此,人们不可能一次性遍历所有桥而不重复。

图2 版画中的哥尼斯堡(上),即现在的加里宁格勒,它表现了哥尼斯堡七桥之谜,莱昂哈德· 欧拉将其表示为一幅简图(下)

哥尼斯堡地图这种简单的数学图是图的首个例子。数学家将构成这幅图的点和线分别称为顶点和边。如今,欧拉已经因为开启了一整个建立在图解分析基础之上的数学分支而被人们铭记。他的这种直觉可被认为是网络科学的首个创立契机。在他之后,许多数学家都曾研究过网络的形式特征,科学家则将它们应用于更加广泛的问题之中:1845年G.R.基尔霍夫的电路,1857年A.凯利的有机成分异构体,1858年由W.R.哈密顿提出的“哈密顿圈”,等等。其中一个著名的应用是于19世纪中期提出的“地图着色问题”。当时,地理学家正在设法计算出绘制地图所需的最小颜色数量,其中相邻的国家应有不同的颜色。这不仅仅是个理论问题:考虑到为数众多的国家和印刷行业中数量有限的不同油墨,使用最少数量的颜色显得至关重要。从经验角度看,三种颜色不够用,四种颜色则似乎很奏效。人们直到1976年才证实了解决方案确为四种颜色。证明基于将一张地图以图的方式呈现出来,其中的节点为国家,边则画在两个共享一个边界的国家之间。


出走的女孩,澳大利亚人和芝加哥工人

1932年的秋天,在两个星期内有14名女孩从位于纽约州的哈德森女子学校中出走。这种出走率不同寻常。学校管理层于是决定调查这些女孩的个性,以便理解这种现象。由于没有发现女孩们的性格有特殊差异的明显证据,精神科医生雅各布·莫雷诺便提出了一种完全不同的解释。他指出这种大规模的出走情形是由出走女孩们在社交网络中的位置引发的。莫雷诺和海伦·詹宁斯一起利用社会计量学,即一种能够识别个体之间关系的技术,绘制了学生之间的社会关系图。他们发现,这些关系是出走的想法在女孩们之间传播的主要渠道。个人在友谊网络中的位置对其模仿出走女孩的行为至关重要。

莫雷诺是第一批将网络理念应用于社会的研究者之一。继欧拉的直觉之后,他的研究成为网络科学创立的第二个关键步骤,它开启了网络科学最重要的分支之一:社交网络分析。30年之后,人类学家采用了类似的方法研究部落的亲属关系,比如对澳大利亚阿伦达人部落的研究。在这个案例中,互为亲属的人们之间的联系图得到绘制。研究人员发现,他们得到的结果图对应着优雅的数学结构。这些以及其他结果都表明,在人类社会的无序之下,暗含着精巧的社会结构,甚至是普遍法则。从那时起,社会科学便广泛运用网络概念来呈现社会结构。许多其他的研究也遵循着这些最初的研究方法,比如,对南美洲妇女群体(A.戴维斯、 B.B.加德纳以及M.R.加德纳等人,1941)、芝加哥工厂的工人群体(E.梅奥,1939)、学童之间的友谊(A.拉波波特,1961),以及对科罗拉多州斯普林斯市吸毒者之间关系的研究(理查德·B.罗滕伯格等人,1995),诸如此类。


随机联系

网络科学创立的第三个重要时刻则随着保罗·埃尔德什和阿尔弗雷德·雷尼这两位数学家在1959年到1961年间一系列论文的发表而到来。埃尔德什乃20世纪最重要的数学家之一,人们称他为“数字情种”。这句话不全对——他也钟爱着图形。这两位理论家研究了某种表示图的数学模型,其中的顶点完全随机地连接。数学研究人员雷·萨洛莫诺夫和阿纳托尔·拉波波特最早于1951年在一篇论文中提出了这种后来被称作随机图的模型。

随机图是一种十分简化的模型,其特征与那些真实网络截然不同。比如,随机性和概率的确可能在结交新朋友的过程中发挥重要作用,但是友谊网络的形成肯定也与许多其他因素相关,比如社会阶层、共同语言、吸引力等等。然而,随机图模型仍然非常重要,因为它量化了完全随机网络的性质。随机图能用作任何真实网络的基准或无效状态。这意味着,我们能将随机图与真实世界的网络进行对比,进而了解概率在多大程度上塑造了后者,以及其他标准在何种程度上起了作用。

以下是构建随机图的最简单方法。我们取所有可能的顶点对,然后为每一对顶点抛掷硬币:如果结果是正面朝上,则画出一个连线;否则我们转向下一对顶点,直到遍历所有顶点对(这意味着我们以 p =1/2的概率绘制顶点连线,但可能会用到 p 的任意值)。通常,图的创建及相关研究都不是人们手动完成的。科学家运用计算机程序,在图纸或电脑屏幕上绘制生成网络图。然而,当网络规模很大时,这项工作就会变得越发困难。此外,人们仅通过目测很难研究相互交织的结构。运用数学工具将图作为抽象对象进行研究能够提供更好的量化的见解。计算机对此也有帮助:模拟使我们能够在计算机的“头脑”中将这种模型可靠地具象化,然后对其进行测量,就像它是个真实的物体一样。如果我们想要将抽象模型与真实世界网络进行比较,现在只需要比较两种情况下的测量数据。

自上世纪60年代被引进以来,随机图模型已成为最成功的数学模型之一,尽管它与现实的联系并不紧密。现在,它是所有网络进行比对的基准,因为任何对此模型的偏离都表明了在许多现实世界网络中存在着某种结构、秩序、规律性和非随机性。


捕获信息之网

当纽约、马德里、伦敦分别于2001、2004、2005年遭遇死灰复燃般的恐怖袭击之后,一些政府机构提议存储电子信息流数据,并将其作为一项反恐措施。在这项提议中,公民之间多年的电话和电邮都会以安全的名义被记录在案。具体的通信内容则不会被储存,仅记录信息的发出者和接收者便已足够(有时候还包括通信的时间和地点信息)。正如警方所知晓的那样,即便这种简单的谁与谁之间相互关联的图景也是追踪人们活动的强大工具。的确,略略看一下某人的电话记录,我们就可以推断出他的习惯、朋友圈以及各种相关的其他数据。

这是网络科学基本方法的一个非常实际也颇具争议的例子。复杂系统由图——通过同样的相互作用而彼此关联的一组等价元

Return Main Page Previous Page Next Page

®Reader's Club