牛津通识读本:进化 [3]
图4 在哺乳动物的黑色素细胞中,从氨基酸前体——酪氨酸合成黑色素与一种黄色素的生物途径。这个途径中的每一个步骤都由一种不同的酶催化。有效酪氨酸酶的缺失将会导致动物的白化病。促黑激素受体决定了黑色素与黄色素的相对量。这种激素的拮抗物的缺失将导致黑色素的形成,但这种拮抗物的存在“关闭”了该受体,导致了黄色素的形成。这就是虎斑猫以及棕毛鼠毛发中黄色与黑色部分形成的原因。让拮抗物失去作用的突变导致了更深的毛色;然而,黑色动物并不总是由这个作用产生,有些只是由于它们的受体一直保持在“开启”的状态,无论它们的激素水平是高还是低。
将食物转化成为能量的方式在各种类型细胞中都大体相同。在此过程中,存在一个能量的来源(在我们的细胞中是糖或脂肪,但对于某些细菌而言,是其他化合物,例如硫化氢)。细胞通过一系列化学步骤分解最初的化合物,其中的某些步骤释放出能量。这种代谢途径就如同一条流水线,包含一连串的子流程。每个子流程都由它们自己的蛋白质“机器”完成,这些蛋白质“机器”就是这个代谢过程中不同步骤所对应的酶。相同的代谢途径在许多生物中都产生作用,在现代的生物学课本中介绍那些重要的代谢途径时,不需要去指明某种具体的生物。例如,蜥蜴在奔跑后感到疲倦,这是由于乳酸的堆积产生的,就像我们的肌肉中出现的情形一样。除了从食物中产生能量,细胞中同样存在着生产许多不同化学物质的代谢途径。例如,一些细胞产生毛发,一些产生骨骼,一些产生色素,另外一些产生激素,等等。对于表皮的黑色素而言,不管是对于我们人类、其他哺乳动物,还是翅膀具有黑色素的蝴蝶,甚至是酵母(例如黑色孢子),其产生的代谢路径都是相同的,而这个代谢路径中所使用的酶也被植物用于生产木质素(它是木材的主要化学成分)。从进化角度思考,从细菌到哺乳动物,代谢途径基本特征的根本相似性再一次变得很容易理解与接受。
这些细胞及身体功能中的每一种不同蛋白质都是由生物基因中的一种决定的(我们将在本章后文中详细解释)。而酶是所有生化途径发生作用的基础。如果在代谢途径中任何一种酶失去作用,将不能产生最终产物,就像流水线上的一环发生问题,产品就无法生产一样。例如,白化病突变是由于一种产生黑色素所必需的酶缺失造成的(图4)。阻断生产途径中的某一环是调节细胞产物的有效方法,因此细胞中存在着抑制剂,用来进行这种调节,正如前文黑色素生产中调节的例子。在另一个例子中,组织中存在着形成凝血块的蛋白质,然而在呈溶解态时,只有在这种前体物质的一部分被切除之后才会形成血块。负责切除的酶同样存在于组织中,但通常呈休眠状态;当血管遭到破坏时,因子被释放出来改变这种凝血酶,因此它立刻被激活,导致了蛋白的凝结。
蛋白质是由几十至几百条氨基酸亚单元之链构成的大分子,这些氨基酸单链与相邻的氨基酸相连,形成了蛋白链(图5A)。每个氨基酸都是一个相当复杂的分子,拥有它们各自的化学特性与大小。在生物体的蛋白质中共使用了20种不同的氨基酸;特定的蛋白质,例如红细胞中的血红蛋白,具有一组有特定序列的氨基酸。一旦有了正确的氨基酸序列,蛋白质链就折叠成为功能蛋白的形状。蛋白质复杂的三维结构完全是由构成它们蛋白链的氨基酸序列决定的;而氨基酸序列则完全由生产此种蛋白的DNA的序列决定(图5B)——这一点我们即将详述。
图5 A.肌红蛋白(一种与红细胞中的血红蛋白相似的肌肉蛋白)的三维结构,图中可见蛋白质长链中所包含的氨基酸,编号为1至150,以及蛋白质中含铁的血红素分子。血红素结合氧气或二氧化碳,而这个蛋白的作用就是运输这些气体分子。
B.DNA结构,DNA是大多数生物遗传物质的载体分子。它包含两条互补链,相互环绕呈螺旋状。每一条链的主干由脱氧核糖分子(S)构成,通过磷酸分子(P)彼此相连。每个脱氧核糖分子对应一种被称作核苷酸的分子,它们构成了遗传学字母表的“字母”。存在四种类型的核苷酸:腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C),胸腺嘧啶(T)。正如在双螺旋结构中所见,一条链上每种特定的核苷酸与另一条链上对应的核苷酸互补。这种配对的原则是:A与T对应,而G则与C对应。在细胞分裂过程中当DNA进行复制时,双链解开,遵循着上述配对原则,一个互补的子链将从各自的母链中产生。由此,在母链中A与T配对的位置将在子链中也同样为T与A。
对于不同的物种中相同的酶或蛋白质三维结构的研究表明,进化上差距极大的物种,例如细菌与哺乳动物间,尽管它们的氨基酸序列已经发生了巨大的改变,它们的蛋白结构经常存在相当大的相似性。我们在前文中提到的肌球蛋白就是一个例子,它在苍蝇的眼睛与哺乳动物的耳朵中都参与了信号传导。这种基本的相似性意味着(尽管十分令人惊讶),在酵母细胞中,往往可以通过引入具有相同功能的植物或动物基因而对代谢的缺陷进行纠正。通过细胞内一段人类基因的表达,具有由突变引起的铵盐摄取缺陷的酵母细胞被“治愈”了(这段基因用来编码Rh血型功能蛋白RhGA,该蛋白可能具有相应的功能)。野生型(未突变)酵母细胞中的这种蛋白与人类RhGA蛋白在氨基酸上具有许多区别,然而在这个实验中,人类蛋白质却能够在缺少相应自体蛋白的酵母细胞中发挥作用。这个实验的结果也告诉我们,一个氨基酸序列被改变的蛋白质,有时也同样能够正常发挥作用。
生物共同的遗传基础
对于所有的真核生物(动物、植物,以及真菌)而言,遗传的物质基础在根本上是相似的。我们对于遗传机制的认识,是它通过某种物质(我们现在称作基因)对个体的许多不同性状进行控制。这一机制由格雷戈尔·孟德尔首先在豌豆中发现,但相同的遗传定律也适用于其他植物以及动物,包括人类身上。控制酶及其他蛋白产生(由此决定个体的特性)的基因是每个细胞中染色体所携带的DNA片段(图6,7)。人们最早在黑腹果蝇中发现基因在染色体上呈线性排列,这个规律同样适用于我们自身的基因组。染色体上的基因顺序在进化过程中可能会发生重新排列,不过这种变化发生的几率极小,因此我们可以在人类以及其他哺乳动物(例如猫、狗)的染色体上发现呈现相同顺序的相同基因。一条染色体本质上就是一个有着成千上万个基因的相当长的DNA分子。染色体DNA与蛋白质分子结合,这些蛋白质负责在细胞核中将DNA分子包裹成整齐的卷(类似整理电脑数据线的工具)。
图6 一对染色体的图示,另有一个放大的示意图展示分布在该染色体上的三个基因,以及它们之间的非编码DNA。这三种不同的基因采用不同的灰度进行表示,表明每个基因都为不同的蛋白质编码。在实际的细胞中,这些蛋白中只有一部分能产生,其他的基因将被关闭,因此它们所编码的蛋白将不会形成。
图7 一个正在分裂的线虫细胞,显示染色体不再被包裹在细胞核膜之中(A);分裂过程中的不同时期(B,C);以及最终形成的两个子细胞,每个子细胞都具有一个被核膜包裹的细胞核(D)。
在更高等的真核生物例如我们人类身上,每个细胞中都包含一套来源于母亲卵细胞核的染色体,以及一套来源于父亲精细胞核的染色体(图6)。在人类体内,父系或母系序列各有23条不同的染色体;在遗传学研究中常用的黑腹果蝇体内,染色体的数量是5(其中一对很小)。染色体携带有详细说明生物体蛋白质氨基酸序列所需的信息,同时还有决定什么蛋白将被生物体生产出来的调控DNA序列。
基因是什么?它如何决定一个蛋白质的结构?基因是基因编码的四个化学“字母”的排列,在它之中,三个相邻的字母(三联体)对应着该基因所编码的蛋白质中的一个氨基酸(图8)。基因序列被“翻译”成为蛋白质链上的序列;同时还有三联体标记氨基酸链的终点。基因序列上的改变导致了突变。这种改变中的大多数会使蛋白质在生产过程中出现一个不一样的氨基酸(但是,由于具有64种可能的DNA三联体字母,却只有20种氨基酸被用于蛋白质生产,有些突变将不会改变蛋白质序列)。纵观整个地球上的生物体,它们的基因编码差异非常微小,这充分说明了地球上的所有生物可能有一个共同的祖先。基因编码首先在细菌与病毒中进行研究,但很快就在人类身上验证并发现了共通性。在人类血红蛋白中,这个编码可能引起的几乎所有突变都已被人类检测到,但从来没有检测到对此特定编码来说不可能实现的突变。
为了生产出蛋白质产物,基因的DNA序列首先需要复制出一条“信使”,由相关联的RNA(核糖核酸)分子构成,它的“字母”序列由一种复制酶从原基因的序列中复制过来。信使RNA与一种由蛋白质聚合物和其他RNA分子组成的精巧的细胞器共同作用,将RNA中携带的信息翻译出来并产生出该基因所指定的蛋白质。这个过程在所有的细胞中本质上都是相同的,尽管在真核细胞中这个过程发生在细胞质中,信使RNA必须首先从细胞核中来到翻译过程所发生的细胞区域。在染色体中,这些基因之间是不编码蛋白质的DNA片段,这些非编码DNA中的一部分具有重要的作用,它们是结合蛋白的结合位点,而这些结合蛋白将根据需要开启或关闭信使RNA的产生。例如,为血红蛋白编码的基因在发育成为红细胞的细胞中被开启,而在大脑细胞中则被关闭。
图8 人类及部分哺乳动物中促黑激素受体蛋白(见图4)部分基因的DNA与蛋白质序列。图中仅显示了该蛋白中全部951个氨基酸中的40个。人类DNA序列在最上方,每三个DNA字母之间有空格,蛋白序列用灰色标记在下方(用三字母的代码表示不同氨基酸)。其他的物种见下排。与人类基因不同的DNA序列用大写字母标记。与人类DNA序列存在不同的三联体密码,如果它们为相同的氨基酸编码,则用星号标出;而编码与人类蛋白质序列不同的氨基酸的三联体则突出标示。许多拥有红色头发的人在三联体151位置上存在氨基酸的变化。
尽管不同生物的生活方式存在巨大差异——从单细胞生物到由亿万个