牛津通识读本:网络 [15]
病毒式营销利用了一种被称为社交传播的潜在心理现象。这是人们模仿其联系人传播闲话、时尚、谣言和观念的大体趋势。这种心理机制也会在创新、团队解决问题和集体决策中起作用。社会学家和心理学家们发现了人类带有明显彼此“模仿”倾向的很多例子。一一1962年,坦桑尼亚所教会学校中的群女孩就经历了一场无法控制笑声的非正常倾向。数月之后,同一所学校里的几十名学生也都表现出相同的症状,而这些学生中的一部分被送往一些村庄安置后,村中其他人也表现出同样令人不安的咯咯笑的症状。经过大量调查,研究该病例的医生A.M.兰金和P.J.菲利普得出结论:这是“集体歇斯底里”的一个病例。1998年田纳西州的一所高中发现了一个类似案例,当时,感觉闻到汽油的老师将这种感受传递给了数百名学生。排除所有外部环境因素后,科学家们得出结论说,某种“情绪传染”机制在其中起了作用。
人们已记录了许多类似的社交传播案例,但近年来科学家们发现,同样的机制还可能在不那么特殊的环境中起作用:例如,肥胖和吸烟似乎也会在社交网络中传播。相互关联的人群共有某种特征或行为主要基于三个原因。首先在于他们属于同一社会阶层这种外部因素:例如,同属较低社会阶层的人吸烟和肥胖的风险较高;同时,与社会阶层较高的人相比,他们更有可能与彼此建立联系。其次,人以群分:吸烟者或那些有着相似体重的人们往往会与有着类似癖好的人成为朋友。第三,社交传播的作用:如果你是吸烟者或超重者的朋友,那你更有可能开始吸烟或增加自己的日常食物摄入量。这三种因素可能同时起作用,但社交传播可能最为重要,不应被低估。社会学家认为,传播的并非某种特定的情况;相反,是人们对何谓恰当的共识得到了传播。这种视角可应用于公共卫生领域,通过采取针对社交网络枢纽节点的措施来培养人们更加健康的习惯。
自然,行为、谣言及观念的传染在许多方面都与疾病传播有所不同。与传染病不同,散布信息必然是有意为之。另一方面,获取信息往往对人有利,因此它更多地是一种主动而非被动感染的过程。学习或被说服所需的接触时间可能比患上疾病要长。此外,许多其他竞争因素也会起作用。如果社交传播是主导因素,均一性将是其内在规则,但事实上,反对简单同化的因素会产生多样性、少数群体和两极分化。无论如何,社交传播在一定背景下或许的确是最为相关的因素。理查德·费曼于1940年代发明了费曼图这种现代高能物理学工具。一些物理学家满心热诚地接受了这种工具,另一些人则对其抱有疑虑,但这些图最终成功了。针对费曼图在美国、日本、苏联物理学家团体中扩散的研究表明,其扩散趋势可与流行病模型十分准确地吻合,前提是将模型中的参数调整为十分不同的值。
网络及动力机制孰先孰后?
古罗马成功的关键因素之一是其紧邻台伯河的战略地位,该河当时乃首屈一指的通信和商业路线。城邦变得更加强大之后,人们便开始营建其强大的道路网络分支。反过来,道路网又成为维持并进一步扩张罗马强权的关键工具,因为路网使得运输货物和军团更加快捷。更多的道路意味着更多的权力,而更多的权力又必然会打造更多道路:结果便如意大利谚语所言,“条条大路通罗马”。我们几乎能在每个重要城市的历史上发现类似的发展模式。扩张中的城市吸引了更多的交通,也需要更多的连接方式(道路、铁路、航线……),这些因素反过来又会增加交通流量和扩大城市规模,而这又意味着更多的连接。通信网络会影响交通的动力,后者反过来又会在反馈回路中重新塑造网络。
网络拓扑如何影响了动力机制这一问题暗含了某种假设:网络乃不可变的结构,过程在它上面发生。现实中,所有网络都会在动力作用的过程中发生改变。因此,仅当动力机制的发生时间比拓扑早很多时,这一假设才有意义。在某些过程中这是合理的:例如,人们每天或每周相互交换的信息会在固定的社交网络中传播,因为通常友谊与亲属关系的更替是按年进行的;或者,城市的车辆交通不论在哪一天都会在固定街道上进行:通常街道连接不会每天都改变。
然而,在其他情况下,这种假设是有缺陷的。例如,在性传播疾病的传播过程中,与他人发生关系的时间顺序尤为重要。与某人建立无保护性关系发生在与受感染的他人建立无保护性关系之前还是之后很不一样。如果我们想研究一个城市十年的发展,那么有必要考虑交通和正在改变的连接之间的相互作用。在类似对等文件共享系统等一些技术网络中,网络结构和信息动力机制在相同的时间段内变化且强烈地相互交织。而食物网中的种群动态能够引起网络的重组。当过度捕捞将某物种数量降至一定水平之下时,食物网会重新排列捕食次序,并让新物种代替旧物种。网络结构和动力机制的耦合在虚拟社交网络发展的特定时刻尤其重要。这些工具提供了个人网络结构和内容的恒定信息流。因此,研究者认为,这种增强的意识可能改变人们创作、维护和影响其社交网络的方式。
一些方法可用于处理网络结构和动力机制耦合这个问题。例如,我们可以通过最优化构建网络模型,其中需要优化的量与网络流量或搜索这样的动力机制相关。更加完善的方法在于修改适应性模型,使得适应性的值取决于一些动态参数。当动力机制继续作用时,适应性也会相应地发生改变;这便可以重组网络。其他策略也是可行的,所有这些都巩固了一个基本观点:多数情况下,当某个动力机制在网络结构中发生或与它耦合时,多数时候我们必须将基本图纳入考虑以充分理解正在发生的情形。
第九章 整个世界是否就是一张网?
据报道,量子力学的创始人之一保罗·狄拉克在谈及物理学家们在20世纪初的革命性发现时说:“其余都是化学过程。”他的意思是,所有科学都能从物理学的基本原理中推导出来。很不幸,仅有少数几种情况可以由量子力学方程精确求解,它们还基本都是氢氦原子。像分子那样更为复杂的东西则必须以近似法或计算机模拟的方式处理。目前,除了少数宏观量子效应,基础物理学当前对我们理解生物、心理或社会而言相对无用。类似的错误还发生在遗传学中,人们错误地将DNA界定为能够解释人类所有特征、疾病和行为的决定因素。一般而言,基础科学成果的应用不应超出其真实的有效范围,人们应当认识到更专业的学科能够提供超出这一范围的更深刻洞见。网络科学也应避免落入被夸大的圈套。其整体性的视野,对差异明显的系统出人意料的相似性的揭示,还有当前对网络概念的文化上的迷恋,所有这一切使得我们很容易将网络科学视为“万用理论”。社会学家、工程师、生物学家和哲学家都曾警告世人注意从网络理论中提取的空洞概括。这类批评多数是合理的,但网络科学的成果不应被低估,其对未来各种发现的潜力也不应受到贬低。
网络科学的第一个主要限制是其缺乏大规模数据。社会科学中使用的调查问卷和访谈等方法十分昂贵且耗时,有时候还容易带有主观偏见。从信息技术(通话记录、电子邮件、社交网络、地理定位、无线射频识别芯片、健康数据、信用卡等等)处获取的数据为我们了解人们的社交关系提供了空前的便利,但这也带来一些问题。披萨送货员会接到许多电话,但多数来自客户而非其朋友:“披萨送货员问题”表明,人们从信息技术数据(比如本例中的通话记录)中整理出相关信息并不容易。此外,还应提及的是,网络数据挖掘也制造了一些涉及隐私以及军事用途的伦理问题。
很多情况下,人们仅能获取部分信息。为了画出水生生物的食物网,生态学家会捕捉鱼类并检查其消化道:即便最杰出的科学家用这种方法也会错过一些物种联系。推导出蛋白质之间物质相互作用的基因方法既能产生假阳性也能产生假阴性结果。互联网和万维网图可以通过从某节点释放“探测器”以探索其周围各边的方式获取:足够数量的路径能很好地呈现网络,但某些边可能从不会被探测器发现。
一旦数据可用,将其呈现在图中则不可避免会将其简化。网络方法的优势之一是其对拓扑的关注,但它忽略了元素的诸多具体特征。如果我们对这些特征感兴趣,图形近似法便显得不够用了。网络模型有时候被修改后可以包含这些特征,但并不总是如此。
当地理(即节点的物理位置)的重要性高过拓扑时,图示法也会不够用。例如,变电站、机场或火车站的位置明显与其连接的安排有关。此外,社交网络和食物网中的节点接近性则能决定建立某种关系的实际可能性。图示法可能遗漏的另一个元素是时间。例如,在性传播疾病中,在某人被他人感染之后与其建立关系明显不同于在这之前与其建立关系:关系建立的时机对疾病的传播至关重要。时机在大量网络中都很重要:例如,科学出版物按时间排序,科学家们只能引用那些之前发表的文献。
有时,识别节点和边绝非小事。我们很容易区分鹰和隼,却很难数得清生态系统中的细菌数量。为了避免低估“微小”物种的数量,生态学家通常会将营养物种里的生物聚集,这些生物共享同样的天敌以及相同的猎物。类似地,社会科学家则会聚集结构上等同的个人:具有相同联结数量和种类的人,比如家庭成员。类似的方法还被用于自主系统层面的互联网以及大脑区域网络等。这些过程必须以连贯的方式进行以获得一个合理的网络。边的定义更为复杂。某公司可能持有另一个公司的小部分或全部资本。两座机场可通过每天一次航班或每小时一次航班相互连接。在所有这些情况中都必须建立阈值,低于该阈值则被视为弱关系而不被记录。为连接加权或设置阈值会强烈影响所得网络的形状,因此必须建立在充足的理由上。
一旦将数据组织为图,就必须仔细解读其结果。网络科学有一整个学科分支都在专门研究可视化,即制造算法以便在纸张或计算机屏幕上合理安排节点和连接。然而,多数结论无法经由目测得出,而要对其进行数学分析。一些批评指出,并非所有复杂网络都具备异质度数分布(在任何情况下,这都绝非数学上的精确幂律)。的确,若网络并非异质,它们也会有趣,但公平地说,有趣的