更新时间:2024-01-22 12:14
1953年,沃森和克里克弄清DNA的双链双螺旋结构之后,分子生物学像雨后春笋蓬勃发展。许多科学家的研究,使人们基本了解了遗传信息的流动方向:DNA→信使RNA→蛋白质。也就是说蛋白质由信使RNA指导合成,遗传密码应该在信使RNA上。
基因密码的破译是六十年代分子生物学最辉煌的成就。先后经历了五十年代的数学推理阶段和1961-1965年的实验研究阶段。 1954年,物理学家George Gamov根据在DNA中存在四种核苷酸,在蛋白质中存在二十种氨基酸的对应关系,做出如下数学推理:如果每一个核苷酸为一个氨基酸编码,只能决定四种氨基酸(41=4);如果每二个核苷酸为一个氨基酸编码,可决定16种氨基酸(42=16)。上述二种情况编码的氨基酸数小于20种氨基酸,显然是不可能的。那么如果三个核苷酸为一个氨基酸编码的,可编64种氨基酸(43=64);若四个核苷酸编码一个氨基酸,可编码256种氨基酸(44=256),以此类推。Gamov认为只有4^3=64这种关系是理想的,因为在有四种核苷酸条件下,64是能满足于20种氨基酸编码的最小数。而44=256以上。虽能保证20种氨基酸编码,但不符合生物体在亿万年进化过程中形成的和遵循的经济原则,因此认为四个以上核苷酸决定一个氨基酸也是不可能的。1961年,Brenner和Grick根据DNA链与蛋白质链的共线性(colinearity),首先肯定了三个核苷酸的推理。随后的实验研究证明上述假想是正确的。
1962年,克里克用T4噬菌体侵染大肠杆菌,发现蛋白质中的氨基酸顺序是由相邻三个核苷酸为一组遗传密码来决定的。由于三个核苷酸为一个信息单位,有43=64种组合,足够20种氨基酸用了
破译密码的竞赛中,美国的尼伦伯格博士走在前面。他用严密的科学推理对蛋白质合成的情况进行分析。既然核苷酸的排列顺序与氨基酸存在对应关系,那么只要知道RNA链上碱基序列,然后由这种链去合成蛋白质,不就能知道它们的密码了吗?用仅仅含有单一碱基的尿嘧啶(U),做试管内合成蛋白质的研究。合成蛋白质必须将DNA上的遗传信息转录到RNA上,而RNA的碱基与DNA稍有不同,一般是有UCGA4种(DNA中是TCGA)。这个实验只用了含有单一碱基U的特殊RNA。这样,就得到了只有UUU编码的RNA。把这种RNA放到和细胞内相似的溶液里,如果上述观点正确,应该得到由单一一种氨基酸组成的蛋白质。这样合成的蛋白质中,只含有苯丙氨酸。于是,人们了解了第一个蛋白质的密码:UUU对应苯丙氨酸。随后,又有人用U—G交错排列合成了半胱氨酸—缬氨酸—半胱氨酸的蛋白质,从而确定了UGU为半胱氨酸的密码,而GUG为缬氨酸的密码。这样,人们不仅证明了遗传密码是由3个碱基排列组成,而且不断地找出了其他氨基酸的编码。
进一步研究发现,不论生物简单到只一个细胞,还是复杂到与人一样高等,他的遗传密码是一样的。也就是说,一切生物共用一套遗传密码。
破译密码的实验研究先后由三个实验逐步发展了四种破译方法,于1965年完成。
体外实验
(1)在体外无细胞蛋白质合成体系中加入人工合成的polyU 开创了破译遗传密码的先河。
自1961年发现mRNA后,许多实验室开始在无细胞蛋白质合成系统中加入mRNA,去研究蛋白质生物合成过程,并表明加入mRNA能刺激无细胞系统中蛋白质合成。1961年,美国NIH的Nirenberg和Mathaei,设想:即然mRNA有刺激无细胞系统中的蛋白质合成作用,加入人工合成的多聚核苷酸亦将会有这种促进作用。按此设想,他们合成了polyU作为模板,以观察无细胞系统中蛋白质合成速率。因为在反应体系中加入高Mg2+浓度,可有利于IF(起始因子)的作用和fMet-tRNANet的形成,从而保证肽链合成的起始不需mRNA的适当信号。当把翻译产物分离、纯化和做序列分析后,结果出乎意料,合成的肽链中的氨基酸残基全部是苯丙氨酸,即polyPhe。于是第一次确认了UUU是Phe的密码子。这样,就在一个偶然的机会开创了破译密码的工作。随后,他们又以polyA和polyC为模板,证明了分别可指导合成polyLys和polyPro,即确定了AAA是Lys的密码子,CCC是pro的密码子。但是类似的实验不能证明GGG是何种氨基酸的密码子,因为polyG产生牢固的氢键结合,形成三股螺旋,而不与核糖体结合。
混合共聚物碱基配对
(2)混合共聚物(mixed copolymers)实验对密码子中碱基组成的测定: 1963年,Speyer和Ochoa等发展了用两个碱基的共聚物破译密码的方法。例如,以A和C原料,合成polyAC。polyAC含有8种不同的密码子:CCC、CCA、CAA、AAA、AAC、ACC、ACA和CAC。各种密码子占的比例随着A和C的不同而不同,例如当A和C的比例等于5:1时,AAA:AAC的比例=5× 5× 5:5× 5× 1=125:25。依次类推。实验显示AC共聚物作模板翻译出的肽链由六种氨基酸组成,它们是Asp,His,Thr,Pro,和Lys,其中Pro和Lys的密码子早先已证明分别是CCC和AAA。根据共聚物成份不同的比例和翻译产物中氨基酸比例亦不同的关系,Speyer等确定了Asp、Glu和Thr的密码子含2AlC;His的密码子含1A2C;Thr的密码子也可以含1A2C;Pro为3C或1A2C;Lys为3A。但上述方法不能确定A和C的排列方式,而只能显示密码子中碱基组成及组成比例。例如,Asp,Glu和Thr的2A1C可能有三种排列方式,即AAC、ACA、CAA。此外,通过反复改变共聚物成份比例的方法亦十分麻烦和费时。
aa-tRNA与确定的三核苷酸序列结合
正当Speyer等人按上述(2)方法奋力时,Nirenberg和Leder于1964年建立了破译密码的新方法,即tRNA与确定密码子结合实验。该方法利用了如下事实:即是在缺乏蛋白质合成所需的因子的条件下,特异氨基酸-tRNA(aa-tRNA)也能与核糖体-mRNA复合物结合。最重要的是这种结合并不一定需要长的mRNA分子,而三核苷酸实际上就可以与核糖体结合。例如,当polyU与核糖体混合时,仅有Phe-tRNA(苯丙氨酰-tRNA)与之结合;相应地Pro-tRNA(脯氨酰-tRNA)特异地与polyC结合。还有GUU可促进Val-tRNA(缬氨酰-tRNA)结合,UUG促进Leu-tRNA(亮氨酰-tRNA)结合等。虽然所有64个三核苷酸(密码子)都可按设想的序列合成,但并不是全部密码子均能以这种方法决定因为有一些三核苷酸序列与核糖体结合并不象UUU或GUU等那样有效,以致不能确定它们是否能为特异的氨基酸编码。
用重复共聚物破译密码
(4)用重复共聚物(repeating copolymers)破译密码:
几乎在上述Nirenberg和Leder工作的同时,Nishimura,Jones,和Khorana等人应用有机化学和酶学技术,制备了已知的核苷酸重复序列。蛋白质在核糖体上的合成可以在这些有规律的共聚物的任一点开始,并把特异的氨基酸参入肽链。例如,重复序列CUCUCUCUCU......是多肽Leu-Ser-Leu-Ser......或者是多肽Ser-Leu-Ser......的信使分子.使用共聚物构成三核苷酸为单位的重复顺序,如(AAG)n,它可合成三种类型的多肽:polyLys、polyArg和polyGlu,即AAG是Lys的密码子,AGA是Arg的密码子,GAA是Glu的密码子。又如(AUC)n序列是polyIle、polySer和polyHis的模板。如此至1965年破译了所有氨基酸的密码子。
遗传学的第二套密码系统(The second genetic code)
以上所述存在于mRNA中的遗传密码称为经典密码系统或第一套密码系统。以下所要讨论的第二套密码系统,蕴含于tRNA分子中,这是自1988年5月份以来在分子生物学领域引人注目的新进展。
(1)第二套密码系统的实验证据-tRNA分子上某些(个)碱基对能决定tRNA的特异性。 早在70年代初,一些实验室就观察到酪氨酸tRNA(tRNATyr)琥珀抑制子在氨基酸接受柄上的突变能使tRNATyr错误地携带谷氨酸(Glu)。同样,CUA琥珀抑制反密码子也能引起其它一些tRNA误被谷酰化。其后的大约十年,有关方面的实验证据少有报道。1984年,Prather等发现突变的赖氨酸tRNA(tRNALys)不仅保留对Lys的特异性,而且也能携带丙氨酸(Ala)或甘氨酸(Gly)。这个突变的误义抑制子tRNALys是在氨基酸接受柄螺旋区的G3 C70被G3 U70碱基对所取代。能够使tRNALeu转变为丝氨酸tRNA(tRNASer)。由此可见,反密码子在决定tRNA的特异性并非是唯一的关键。又比如,琥珀型抑制性半胱氨酸tRNA(tRNACys)苯丙氨酸tRNA(tRNAPhe)和丙氨酸tRNA(tRNAAla),其反密码子均是CUA,然而它们却携带不同的氨基酸。。colitRNAAla的氨基酸接受柄上单个碱基对G3 U70,能够使该tRNA失去负载Ala的功能;进一步将G3 U70引入tRNACys或tRNAPhe,亦可予二者携带Ala的功能。他们主要采用上述三种琥珀型抑制性tRNA在二氢尿嘧啶柄(D柄),反密码柄、TψC柄、氨基酸柄和氨基酸接受柄等部位进行单个或多个碱基突变,然后检测宿主E.coliFTP3689的表型抑制作用。发现总共36种不同突变的tRNA中只有在氨基酸接受柄上A3,C70和C6G7C66G67C70三种突变具有清楚的Sup-表型(即这种宿主E.coly在二天内不生长),而这三种突变共同都有原来的碱基对G3 U70碱基对的改变。显而易见,tRNAAla氨基酸接受柄上G3 U70单个碱基对决定着Ala的特异性。本文作者也观察到:只有在多胺下,哺乳动物(大鼠、牛)肝异亮氨酸tRNA(tRNAIle)才能负载ILe。通过测定tRNAIle序列证明它的氨基酸接受柄的G5 G69碱基不配对。多胺(精胺)通过在此处的桥接,稳定了tRNAIle的空间构象,从而使tRNAIle氨基酸酰化。换言之,即G5 G69对tRNAIle负载可能有决定性作用。
(2)第二套密码系统的概念和特征
根据上述Hou和Schimmel等人的工作,ChristiandeDuve提出了第二套密码系统的概念或学说。该学说认为:tRNA氨基酸接受柄有一辅密码区(Paracodonregion),可以被氨基酰tRNA合成酶(aaRS)识别,并决定tRNA的特异性。他认为第二套密码系统蕴含于aaRS结构中作者将第二套密码系统的特征描述为:[1]与经典密码系统不同。辅密码子密码系统或第二套密码系统是非简并性的(nondrgenerate)。可能只有20种aaRS,每种aaRS能够识别特异于某种氨基酸的所有tRNA,这种识别与该种特异tRNA的不同特征有关。[2]第二套密码系统比经典的密码系统对氨基酸更具有决定性,这与密码子和相应的氨基酸间的立体化学相互反应有关。认为辅密码仅与酶-氨基酰-腺苷酸(aaRS-aa-AMP)发生一个非常简单的反应,而tRNA则起着删除错误氨基酰的作用。[3]第二套密码系统比经典的密码系统更原始。一些作者猜测tRNA起源于携带氨苷酰的寡核苷酸,其原始形式能与氨基酸直接反应。
(3)对第二密码系统的思考
上文提到的Hou和Schimmel的工作,是ChristiandeDuve提出第二套密码系统概念的主要依据。在Hou和Schimmel的论文中,只认为在氨基酸柄上的三种突变(A3,C70和C6G7C66G67C70),由于都有原碱基对G3 U70改变,抑制了tRNAAla的正常负载,没有观察到由其它部位突变所产生的影响。tRNA的其它部位对辅密码子区特异性功能的发挥可能具有协助作用。因为单依靠tRNA分子的单个碱基对决定其负载的特异性,这不仅尚未得到用其它tRNA大量实验证实,而在理论上造成tRNA氨基酰化错误机率增高,相应使遗传变异的危险性加大。不论是经典的密码系统或第二套密码系统的表达均需aaRS。aaRS与tRNA倒L型构象的内侧结构(包括氨基酸接受臂和柄,D反密码和环)结合。然而,已有的结论认为与aaRS相接触的tRNA部位对aaRSR的识别作用是非必需的。至今已发表的tRNA序列(除个别低等的生物的外),几乎都含76或77个碱基,其中15或16个位点是保守性的(conserved position)即固定地在所有tRNA中存在。这些位点是:U8,A14,G18,G19,A21,U33,G53,T54,ψ,C56,A58,U60,C61,和3'末端的C75,C76,A77。其它61个部位在不同来源和不同tRNA中是可变的(variable position)tRNA上61个可变碱基与mRNA中含的61个有意义密码子达到巧合。
然而,deDuve认为第二套密码系统存在于aaRS结构中,并假定仅仅是辅密码子与aaRS-aa-AMP或aa-aaRS复合物的一个简单反应。酶是一种蛋白质,而蛋白质怎么能作为携带遗传信息的载体呢?aaRS上的某些区域含有一些残基可与辅密码子的核苷酸反应,但无法把所有氨基酸侧链与tRNA的核苷酸匹配起来。一些科学家提出RNA在原始时代具有多种功能,例如携带信息,催化活性和转移信息。在进化过程中,才形成分工负责,即RNA将携带信息的功能交给DNA,催化活性由酶(蛋白质)承担,RNA本身仅保留转递信息功能。至今上述三种功能仍不同程度残留于RNA的事实是对上述分子进化的强有力支持。据此认为:第二套密码系统存在于tRNA分子本身,而不应存在于aaRS结构中。
但立即受到人们高度注目,破译第二密码系统的意义不仅仅限于tRNA分子本身生物学功能的认识,更重要的是将对生物化学,生物起源,分子生物学及遗传学产生重大影响。