六、遗传物质——核酸

自然界所有生物的遗传物质都是核酸。核酸有两大类:脱氧核糖核酸DNA和核糖核酸RNA。除了有些小病毒的基因是RNA外,其余所有生物的基因都是DNA。

DNA和RNA都是又细又长,有时是极长的分子。DNA是有规则骨架的聚合物,具有交错的磷酸基和糖基。DNA中糖为脱氧核糖。每个糖基上都连着一个平面的小基团一碱基。碱基有四种:分别叫腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)。DNA片段的碱基顺序中包含着遗传信息。RNA的结构与DNA类似,只是核糖代替了脱氧核糖,尿嘧啶(U)代替了胸腺嘧啶(T)。

DNA通常以双螺旋存在,两条单链反向平行,主链位于外部,碱基堆积在内部。最重要的特征是碱基特异性配对。即一条链上的一个碱基与另一条链上的一个碱基配对,方式是:

T=A GC

A=T CG

细胞在复制 DNA时,需要解开双螺旋,并以每条单链为模板形成新的互补链,产生两条双螺旋链,每一条双螺旋链都含有一条亲代链和一条子代链。由于新生链的碱基同样遵守配对规则,故能得到两条与亲代一样的双螺旋。这种配对的机制是遗传的分子基础。

可以用图2来表示配对的机制。

1.核酸的主要功能——编码蛋白质

核酸的主要功能之一是编码蛋白质。蛋白质分子是具有规则骨架的多聚体(称为多肽链)并且侧链基团的间隔相等。核酸的骨架和侧链基团与蛋白质的骨架与侧链基团在化学上完全不同。蛋白质中发现的侧链有20种,而核酸中只有4种。

在蛋白质中发现所有的氨基酸(除甘氨酸外)都是L-型氨基酸,L-型氨基酸与D-型氨基酸互为镜像。

蛋白质的合成发生在称为核糖体的复杂的“生化机器”中,并且需要一系列的转移RNA和一系列的特殊的酶。序列信息由信使RNA传递。在大多数情况下,这种单链的信使RNA是以某段特定的DNA为模板,按碱基配对原则合成的。核糖体沿着信使RNA移动,每一次阅读三个碱基。总的过程是DNA→mRNA→蛋白质,箭头代表了信息传递的方向。

每个核糖体不仅包含有许多蛋白质分子,还包含一些RNA分子,其中有两种RNA分子相当大。这些RNA不是信使,它们是核糖体结构的组成部分。当肽链合成以后,它将自发的折叠成复杂的三维结构,使得蛋白质能够行使高度专一性的功能。

不同的蛋白质分子大小各异。典型的蛋白质分子含有几百个氨基酸。因此编码蛋白质的基因长度通常在1000个碱基对以上。DNA的某些其他片段作为调控序列决定特定基因的启动和关闭。

某些微小的病毒的核酸大约有5000个碱基对,编码少数几种蛋白质。一个细菌细胞的DNA可能有几百万个碱基对,通常呈环状,编码几千种不同的蛋白质。而人的细胞大约有30亿个碱基对,分别来自父亲和母亲,编码约10万种蛋白质。20世纪70年代,人们发现高等生物的DNA中包含没有明显功能的DNA大片段(称为内含子)。

2.中心法则

中心法则是一个重要的假说,它认为一切生物的遗传物质都是由绞成双螺旋的两股DNA组成。遗传基因编码在这种双螺旋里,通过以下两个过程来控制细胞活动。先由DNA分子产生RNA分子的转录过程,再由RNA指导蛋白质合成的翻译过程。这种“DNA-RNA-蛋白质”历程几乎可从一切生物中见到,但是十几年前发现了一组病毒,这组病毒能使RNA转变成DNA,称为反转录,对中心法则进行了修正。图3表示了遗传信息传递的方向,图中箭头代表序列信息的传递方向,实线表示普通的传递方向,虚线代表异常的传递方向,没有用箭头表示的信息传递是不可能发生的。信息通常是按实线的方向传递的,在一些个别的例子中也会按虚线方向传递。但必须注意信息无论如何是不会由蛋白质传出的。

在罕见的情况下,某些RNA病毒,例如流感病毒和脊髓灰质炎病毒,将按虚线从RNA传到DNA(逆转录)发生在RNA逆转录病毒中,艾滋病(AIDS)病毒就是其中一例。从DNA到蛋白质的虚线传递是极罕见的。在某些特殊条件下,试管中的单链DNA可以起到信使的作用,但在自然界中是不会发生的。

在探索遗传信息的进化和起源方面,有些生物学家认为RNA是遗传信息的第一个重要分子,DNA则是新发展物。RNA的多功能性发现支持了这种论点,因为它贮存信息,并通过与DNA十分相似的方式进行复制,但它又不同于DNA,不能协调蛋白质合成。近年来又不断有证据证实RNA分子也具有酶活力。如果在生命历史的某个时刻,RNA把信息传递给DNA,那就必须有一个反转录的原始机制。反转录本来认为是少数病毒特有的,现在看来,可能是其他病毒和高级有机体的本能。

3.双螺旋DNA

双螺旋DNA是一种了不起的分子。现代人的历史约有5万年,文明的历史几乎不到1万年,美国的历史仅有200多年。可是DNA和RNA却至少存在了几十亿年。从古至今,双螺旋一直存在并活跃着。DNA现在己是一个为人所熟知的名词。每个中学生都知道“DNA是由4个字母写成的长长的化学信息”。每条链的主链几乎完全相同,4个字母(碱基)以一定的间隔连在主链上。正常的DNA结构包括两条单独的链,相互盘旋形成双螺旋。克里克在他所写的《狂热的追求》一书中说:与其说沃森和克里克得出了DNA的结构,不如说DNA的结构造就了沃森和克里克。他们因为确定了DNA的结构而获得了诺贝尔奖。

DNA的双螺旋结构的确定被认为是20世纪自然科学的最重大的突破。它是由很多科学家的劳动铸成的。首先是英国威尔金斯(M.Wilkins)和富兰克林(R.Franklin)拍摄的DNA X射线图。据此,结晶学家就可以推算出DNA分子中各个原子在空间的排列。正当威尔金斯实验室的科学家们苦苦思索着DNA的可能结构模型时,在英国剑桥大学卡文迪许(Cavendish)实验室进修的美国人,时年24岁的沃森和原在实验室工作的克里克合作,也在探索着DNA的结构,可是由于没有得到清晰的X射线衍射图,而研究工作进展迟缓。一次偶然的机会,他们看到了威尔金斯这张新摄的X射线衍射图,从中得到了新的启发,茅塞顿开,结合查盖夫等人发现的碱基配对规则,立即悟出了双螺旋结构的奥秘。他们只花了几个星期的时间经过一两次的失败,就完成了构思 DNA分子模型的全部工作。 1953年4月,沃森和克里克将他们提出的DNA双螺旋模型连同威尔金斯实验室的X射线衍射图一起,发表在同一期的《自然》杂志上。

图4就是沃森-克里克的DNA结构模型。从这模型中我们可以看到DNA由两条核苷酸链组成,它们沿着中心轴以相反方向相互缠绕在一起,就像一条长长的电灯花线。我们再把这种结构的局部放大,就可以看出这种结构就像一座螺旋形的楼梯,如图5,楼梯两侧的扶手是两条多核苷酸链的糖-磷基团交替结合的骨架,而楼梯的踏步就是DNA的碱基对,它们通过一种较弱的化学键-氢键相互结合在一起。根据X射线衍射图的计算,这个螺旋的直径是一定的,也就是说两条核苷酸链间的距离几乎是相等的。前面说过碱基有两类,它们的分子大小不一,嘌呤碱分子要大一些,嘧啶碱的分子比较小一点,因此相同的碱基配对必然造成螺旋的直径不一,显然这与实验事实不符。为了解释这一问题,沃森和克里克提出DNA分子的每一个碱基对一定是由一个大一点的嘌呤分子和一个小一点的嘧啶分子所组成,这种碱基互补的关系,构成了双螺旋的恒定的直径。

因为DNA的两条链通过碱基间形成的氢键连在一起,所以还要考虑到碱基对间氢键生成的可能性。由于A-C或G-T对在化学结构上不宜于生成适合配对的氢键,而A-T和 G-C能生成两对或三对氢键。因此,DNA分子中只能是A与T或G与C配对。这样的结构为查盖夫等人发现的碱基配对规律找到了正确的解释,也说明了为什么在整个分子中A的总数总是等于T,而G的总数总是等于C。

沃森和克里克的模型后来为许多实验证明是完全正确的。沃森和克里克的伟大发现一发表,就立即轰动了生物学界和物理、化学界,因为他们第一次以准确的语言回答了核酸是怎样可能成为遗传物质的,从而开辟了分子遗传学研究的新天地。

4.核酸RNA的世界

20世纪60年代,克里克、奥吉尔、伍斯分别研究早期遗传系统时,发现RNA把基因的碱基顺序翻译成蛋白质的氨基酸顺序时,具有多方面的作用,提出RNA可能出现在DNA之前。进入80年代,奥吉尔等人在无蛋白质参与下,成功的合成出寡聚核苷酸,支持了RNA出现最早的说法。

考虑到生命起源的分子过程时,如果没有蛋白质,仅有RNA能否自我复制?1983年,艾尔麦恩等确认大肠杆菌和枯草杆菌RNase磷上的RNA是价真货实的酶,因为该部分能独立加工tRNA前体,切断它5'端上的磷酸二酯键。1986年,塞克确认四膜虫核糖体 rRNA的内含子也是地道的酶,因为它能独自切除自己,并连接两侧的外显子和催化两个以上的内含子寡聚化反应。还能像聚合酶一样,以寡聚核苷酸为底物,在自己携带的分子内模板上,合成出多聚核苷酸。吉伯特(Gilbert)指出,RNA酶比蛋白质酶催化反应效率更高,速度更快,认为生命起源之初是“RNA的世界”。