牛津通识读本:网络 [3]
表1 社交网络关系的分类
图论让我们能为边编码更加复杂的关系,当关系并非对称的时候更是如此。狼捕食羊,博客链接到大报,一些人爱上另一些人;相反的情况绝少为真。在这种情况下,图中的关系乃某种单行道,我们可在其中朝着一个方向前进,但不能逆行。如果给边添加方向属性,则得出的结构为有向图,其中的关系由箭头指示。在这些网络中,我们有入度和出度分别测量节点向内与向外的连接数量。
到目前为止,我们所考虑的关系都是二进制的——它们仅有两个值。这种二分关系要么存在,要么不存在:例如,与某人结婚或者被某人雇用。然而,这种关系在统计上都是例外:绝大21多数情况下,关系展现出广泛的强度变化。捕食以吃掉猎物的数量计算,网页则能被零星或大量的链接关联,而爱情的强度则从轻微的吸引到强烈的激情不等。这些进一步的特征对应于我们赋予关系的权重。例如,加权网络可能作为个体或事物之间不同交互频率的结果出现。
我们对基本图结构的其他修改也是可能的,且处理这些事物的技术非常有趣。比如,大部分社交网络研究致力于了解不同种类的关系如何互相影响。然而,网络方法的优点在于,在某些情况下,忽略所有或大多数具体细节是合理且有效的:有向网络变得无向,权重被移除,多重连接坍塌为某条单独的边等等。结果表明,这种彻底的简化仍然能够捕获大量信息。
第三章 网络世界
网络组学
上世纪80和90年代,人们倾向于认为在某种方式上一切都是由基因决定的。报纸上的报道都与“同性恋基因”“肥胖基因”“暴力基因”或者“酗酒基因”有关。这种态度呼应了人们对人类复杂性的秘密隐藏在基因组中的期望。DNA——细胞核中包含基因的脱氧核糖核酸分子——又称“生命的软件”,该程序负责生命体的每一个特征正是其中代码功能的障碍导致了所有的疾病。这种图景引发了人们对基因组进行测序的风潮,而人类基因组图谱于2001年2月的发布将这个风潮推向了顶点。测序的结果令人十分惊讶,人类的基因数并不比线虫多多少,而且比某些种类的水稻基因还少。人类几乎与类人猿有着相同基因组的推断是合理的,但问题是人类基因组也与老鼠类似。软件的隐喻并不支持这一证据:DNA序列本身并不能解释我们所能观察到的物种差异,更不用说单个个体的所有特征和疾病了。事实上,生物的基因与其相应的宏观特征之间还隔着一系列漫长的步骤。此间的变异决定了不同的结果。
基因之上的第一层复杂性由基因调控给出。包含在DNA中的基因被转录和翻译以产生蛋白质。蛋白质几乎在生命的各个方面都起着核心作用:肌肉运动、血液循环、承担酶的作用、结合激素等等。此外,蛋白质还彼此相互作用:蛋白质的产生可能受到细胞内现有蛋白质的促进或阻碍。这些相互影响之间的微妙平衡对于生命而言至关重要。例如,p53这一单个蛋白质的突变就伴随着大量不同的癌症。这些交织的激活和抑制模式产生出了基因调控网络。在这个网络之中,节点为基因,连线则是关联某个基因与其他基因表达的反应链条。
蛋白质以所有可能发生的方式相互作用,这代表着另外一个层面的复杂性。例如,一些蛋白质可以结合在一起。这些大分子像分子机器一样起作用,它们在细胞这种机器中发挥着自己的功能。为此,蛋白质必须具备正确的几何形状以彼此契合。当蛋白质以错误的方式折叠时,就可能出现一些问题。比如,人体中对应“疯牛综合征”(又称克雅二氏病)的蛋白质(即朊病毒)就被认为是错误折叠的。蛋白质之间所有可能的实体联系可表示为网络。在蛋白质相互作用网络中,顶点为蛋白质,而如果蛋白质在细胞中的确相互作用,则可在相应的点之间画出一条边。
蛋白质并不足以让细胞工作。细胞通过许多不同的分子与外界环境交换着物质、能量和信息,参与其中的反应数达百万级。饥饿、饱腹感、寒冷以及生物体大致上所经历的所有状态都赖于这种被称为新陈代谢反应的集合。而通过一系列中间步骤将一个分子转化为另一个分子的反应链则被称为代谢途径。然而,细胞中的反应很少遵循有序序列的模式。例如,反应终端的分子经常会与开端处的分子相互作用以终止反应。这种反馈过程就闭合了反应链中的一环。所有这般路径的集合就产生了复杂的代谢网络。
因此,生物体是几层网络共同作用的结果,而不仅仅是简单基因序列的决定性结果。基因组学中已经加入了表观基因组学、转录组学、蛋白质组学、代谢组学等研究相关层级的学科,这通常被称作组学革命。而网络正是这场革命的核心。
思维之网
直到18世纪,“灵魂”可以体现在某个器官中都是一个奇怪的设想。但是,医生已经意识到中风或者其他脑损伤可能会危及关键的认知功能——心与脑之间的关联从那时开始变得明显起来。当时,解剖学家弗朗茨·约瑟夫·加尔便敢于提出所有心理官能必然起源于大脑这种想法。他确定了大脑中的27个“器官”,每个器官分别负责颜色、声音、记忆、言语,以及友谊、仁慈、骄傲等等。这种想法听起来如此异类,以至于加尔不得不逃离维也纳,进而在激进的法国找寻避难所。
后来,几位生理学家试图通过比如从鸽子的大脑中去除切片这样的方式验证加尔的理论。然而,他们并未找到加尔所设想的器官存在的任何证据。因此,他们得出结论说,大脑是产生思想的一个均匀、未经分化的统一体:如其中一位生理学家所说,“大脑分泌思想就像肝脏分泌胆汁一样”。这种观念在1860年代保罗·布罗卡的研究出来之前一直占据主导地位。在表达性失语症患者的尸体解剖中,布罗卡总能在他们大脑左侧的额叶区域发现一些损伤。在确定了人们现在称其为布罗卡区域的大脑部分之后,他便宣称,“我们用左脑说话”。从那时起,神经学家找到了负责不同活动的多个功能中心,但他们也发现这些中心区域绝少孤立运转:大脑不同区域的整合对其功能而言至关重要。
网络在被划分为专门领域的大脑模式和作为整体的大脑模式之间架起了桥梁(这与社会科学的情况并无不同,在这个领域中,网络允许我们从个人和共同体之间的某个层面描述社会)。大脑中遍布网络,其中的各种网状结构在专门的区域之间提供了整合。在小脑中,神经元形成了一个个不断重复的模块:它们的相互作用被限制在了相邻的模块之间,这与晶格中发生的事情类似。而在大脑的其他区域,我们发现了随机连接现象,即局部、居间或者遥远神经元之间的连接概率大致相等。最后,新皮质——哺乳动物的许多高级功能所涉及的区域——则将局部结构与更加随机且遥远的连接相结合。一些科学家认为这些线路体系可能负责主体意识:涌现的良知便可能是某种足够复杂的网络结构作用的结果。
确定这些神经网络的实际结构十分困难,因为细胞数量巨大,并且探测它们困难重重。我们仅掌握了那些十分简单的生物的详细神经网络图,比如一种名为秀丽隐杆线虫的寄生线虫。这种一毫米长的透明生物能存活三周,它仅有300个神经元,却是分子生物学界的超级明星。秀丽隐杆线虫是一种模式生物,即特别适于实验的生物,因为科学家对其特征了如指掌,且它在某些方面与人体类似。这种半透明的蠕虫通常是新药和新疗法实验的第一个基准。
目前,人们还不可能为人类大脑绘制类似的神经网络。然而,我们可以使用另外一种策略。当人们执行一个动作,即便简单如眨眼,来自神经元的电信号风暴就会在大脑中的数个区域爆发。这些区域可以通过诸如功能性磁共振这样的技术加以确认。通过这种技术,科学家发现不同的区域会发出相互关联的信号。也就是说,它们显示出某种特殊的同步现象,这表明它们可能相互影响。可将这些区域视为节点,而如果它们之间存在足够的相关性,则它们两两之间便可画上一条边。同样在这个层次上,大脑表现为相互连接的元素集合。人的每个动作都会点亮脑中的某个连接区域。
盖亚的血管
1999年,旧金山湾区经历了大规模的藻类暴发。通常,藻类的这种暴发是农业密集用地的结果:我们将氮、磷等化肥排入海中后,它们就会成为藻类的营养物。然而,本案例中的情况并非如此,因为一些政策和限制已经减少了从不同河流排入海中的营养物污染水平。加利福尼亚州的生态学家们通过搜集三十年的观察数据得出结论说,藻类暴发有着复杂得多的原因。1997年和1998年,人们记录到了最强的“厄尔尼诺”现象之一,紧随其后的便是1999年同样强大的“拉尼娜”现象。这些现象导致了当时加利福尼亚生态系统的变化。深海处冰冷的富营养化海水涌至海岸。这些营养物质吸引了海洋中的生物——鲽鱼和甲壳类动物——进入湾区。这些动物是湾区双壳类动物的捕食者,而后者反而是藻类蔓延的障碍。双壳类动物由于捕食者的27增加而种群崩溃,这成为藻类暴发的直接原因。触发这种多米诺效应的条件可能来自正常的气候波动。然而,其后果对人类而言却是一种警告:气候变化,特别是极端气候的频率增加,可能对生态系统产生意想不到的影响。
旧金山湾区海藻暴发背后的核心结构是食物链——一系列物种的连接:鲽鱼和甲壳类动物捕食双壳类动物,双壳类动物消耗藻类。生物以食物链的方式从彼此身上提取他们生存所需的能量和物质(这并非生态系统内物种之间唯一可能的相互作用:生物体也可以建立互利的相互作用,比如开花植物与其授粉昆虫之间的相互作用)。每个食物链都从基位物种开始,比如植物和细菌。这些物种不会捕食其他物种,它们通过转化阳光、矿物质和水而直接从环境中获取资源。这些资源以接连的捕食方式沿着食物链顺次转移。中位物种既是捕食者也是猎物。而顶位物种(处于食物链顶端)则不被任何别的物种捕食。食物链帮助我们理解为何渔业会崩溃,比如70年代秘鲁鲥鱼产业的境况。在大规模的无差别捕鱼期之后,像鳕鱼或金枪鱼等捕食者就会