更新时间:2024-01-10 19:39
2001年2月12日,由6国的科学家共同参与的国际人类基因组公布了人类基因组图谱及初步分析结果。这个被誉为生命科学“登月计划”的研究项目取得重大进展,为人类揭开自身奥秘奠定了坚实的基础。美、英、法、德、日和中国6国先后参加人类基因组对23对染色体DNA大规模测序的国际合作,最终绘制了一张类似化学元素周期表的人类基因组精确图谱。
1543年,比利时解剖学家A·维萨里(1514-1564)发表了划时代的著作
《人体的构造》,开创了人体解剖学,使人们从宏观上了解了自己。“人类基因组计划”建立的人类基因组图,被誉为“人体的第二张解剖图”,它将从微观上或者说从根本上使人类了解自己。
2000年6月26日,美国总统克林顿和英国首相布莱尔联合宣布:人类有史以来的第一个基因组草图已经完成。2001年2月12日 中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果。
人类基因组计划中最实质的内容,就是人类基因组的DNA序列图,人类基因组计划起始、争论焦点、主要分歧、竞争主战场等都是围绕序列图展开的。在序列图完成之前,其他各图都是序列图的铺垫。也就是说,只有序列图的诞生才标志着整个人类基因组计划工作的完成。
2003年4月15日,在DNA双螺旋结构模型发表50周年前夕,中、美、日、英、法、德六国元首或政府首脑签署文件,六国科学家联合宣布:人类基因组序列图完成。
人类基因组图谱的绘就,是人类探索自身奥秘史上的一个重要里程碑。它被很多分析家认为是生物技术世纪诞生的标志,也就是说,21世纪是生物技术主宰世界的世纪。正如一个世纪前量子论的诞生被认为揭开了物理学主宰的20世纪一样。
由美国国立人类基因组研究所(nhgri)和能源部(doe)领导的ihgsc不久前宣布,人类基因组测序工作已圆满完成,其发表在2004年10月21日nature(2004,431:931)上的分析
报告对2001年2月发表的初步分析报告进行了补充。这篇最新分析报告不但为世人展现了一张精度大于99%、误差小于10万分之一的精确版人类基因组图谱,而且还进一步纠正了蛋白编码基因的数量,仅为2万~2.5万个,而非原先估计的3万~3.5万个。新基因组图谱 准确率达99.999%
旨在破译人类基因组常染色质遗传密码的人类基因组计划(hgp)自1990年启动至2003年结束,历时共13年, 该计划由ihgsc来完成。ihgsc是由法国、德国、日本、中国、英国和美国等6个国家20个研究所的科学家组成的开放性国际协作组织,全球2800余名科学家参加了ihgsc的工作。
2001年2月,ihgsc宣布,人类基因组草图已经完成。以今天的眼光来看,草图显然存在很多重要的不足,例如,仅测出了约90%的常染色质基因组序列,而且序列之间存在147821个未检测出的空缺等等。
在2001-2003年之间,ihgsc的不懈努力终于将此草图转化为今天这张既高度精确又相当完整的人类基因组图。此外,在这段时间内,还陆续发表了关于第2、6、7、9、10、13、14、19、20、21、22号染色体和y染色体的详细评注和分析,其余12条染色体的资料不久也将发表。
现在的基因组序列(buiid35)共包含28.5亿个核苷酸,它近乎完整,涵盖了99%以上的常染色质基因组序列;准确率为99.999%,也就是说误差率只有1个碱基/10万个碱基对,比最初制订的目标精确了10倍。
序列的连续性亦获得了显著改善,常染色质基因组序列中仅存在341个空缺。现在,平均每一段连续序列含有3850万个碱基对,约比2001年版草图的81500个碱基对长475倍。这些没有中断的已知序列可以在很大程度上帮助科学家寻找目标基因及其邻近的调节目标基因活性的序列,并显著减少他们寻找疾病相关性短而少见的序列的工作量和费用。在剩余的341个空缺中,很多与片段的重复(segmentalduplications)相关,需要采用新的方法才能将其填满。
ihgsc所完成的测序工作不仅完整而且精确,足以进行一些对敏感性要求较高的科学分析,例如基因数目的研究,疾病相关性重复片段的研究,以及进化过程中基因“生”或“死”
的研究。该基因组序列的资料已于2003年4月被载入免费公用数据库。“完成”并非意味着现在的人类基因组图就是完美无缺的。虽然与2001版草图相比,空缺已经从近15万个减少至341个,但是人类基因组序列的这些顽固空缺已很难用现有的技术来填补。填补这些空隙需要做进一步的研究,并需要采用新的技术。
美国马萨诸塞州麻省理工学院和哈佛大学broad研究所所长lander说:“已完成的人类基因组序列在准确率、完整性和连续性方面远远超过了我们的预期目标。它反映出全球数百名科学家为了一个共同目标——为21世纪的生物医学奠定扎实的基础——而进行大协作的奉献精神。”
仅有2万~2.5万个蛋白编码基因
ihgsc最新分析所得出的最出人意料的结果就是,人类基因组只含有2万~2.5万个蛋白编码基因。
nhgri所长collins说:“仅仅在10年以前,大多数科学家还认为,人类基因组大约含有10万个蛋白编码基因。3年前,当我们对人类基因组序列草图进行分析时,我们估计人类约有3万~3.5万个蛋白编码基因,这在当时已经使很多人感到震惊。而刚刚结束的分析结果发现人类的蛋白编码基因数比预计的还要少得多,这使我们对人类基因组的真实情况有了更准确的了解。全世界的科学家都可以从免费公用数据库中获得该高度精确的人类基因组序列,这就使他们有可能对人类遗传学及其影响人类健康和疾病的机制进行更精确的研究。”
人类基因组分析的主要目的之一就是确定人类的全部基因。基因是编码特定蛋白质的一段dna序列,是遗传的基本功能单位。目前的研究结果显示,人类基因组有19599个已经获得确定的蛋白编码基因,另外还有2188段可能为蛋白编码基因的dna序列。
英国wellcometrustanger研究所rogers说:“由于2001年版人类基因组草图不够完善,因此导致了一些早期基因模型是错误的。基因鉴定仍是一项艰巨的任务。除了其他生物的基因组序列、更好的计算机化模型和其他手段的改进外,人类基因组测序工作的完成必将为基因鉴定工作提供极大的帮助。”
人类基因重复片段高达5.3%
科学家们认为,已完成的人类基因组序列不但确定了更为确切的人类基因数量,而且与2001版基因组序列草图相比,质量也有显著的提高,并且使人们对某些现象有了征(胸腺发育不良)。美国圣路易斯市华盛顿大学基因组测序中心前主任、西雅图市华盛顿大学基因组系主任waterston说:“以前只有基因组序列草图的时候,要对重复片段进行研究几乎是不可能的。通过全世界科学家坚持不懈的努力,现在我们已经可以对人类基因组中这一重要而快速进化的部分进行研究了。”
重复片段覆盖了5.3%的人类基因组,显著多于大鼠的基因组(约为3%)或小鼠的基因组(在1%~2%之间)。重复片段为人们开启了一个了解人类基因组是如何进化的以及人类基因组目前正在经历什么样的变化的窗口。人类基因组如此高的重复片段百分比表明,在最近4000万年内,人类的遗传物质经历了快速的功能变革和结构改变。这大概就是人类具有独特的特征,从而有别于其非人类灵长类动物祖先的原因。
ihgsc在分析中发现,重复片段在不同的人类染色体之间的分布差异很大。y染色体就是一个最极端的例子,其重复片段占总长度的25%以上。有些重复片段往往群集于每
条染色体的中部(着丝粒)或末端(端粒)附近。科学家们推测,基因组可能将着丝粒和端粒处的重复片段用作一个进化实验室,来生成具有新功能的基因。揭示基因的“生”与“死”
已完成的人类基因组序列准确度很高,这使科学家有可能了解在人类进化过程中基因的“生”和“死”。科学家在人类基因组中发现了1000多个新基因,这些基因是大约7500万年前人类与啮齿类动物向不同方向进化以后产生的。这些基因多数是最近通过基因重复产生的,与免疫、嗅觉和生殖功能有关,例如,人类基因组中最近重复的两个基因家族分别编码两组蛋白质,妊娠特异性β1糖蛋白和绒毛膜促性腺激素β蛋白,这两组蛋白质可能与人类独特的较长的妊娠期相关。
此外,科学家们还利用已完成的人类基因组序列发现并鉴定了33个几乎没什么变化的基因,但是由于它们在近期发生了1个或1个以上突变而导致了其功能丧失(或称为“死亡”)。科学家通过将这些基因与大鼠和小鼠基因组中的对应基因(鼠类中这些对应基因的功能仍保持)进行对照比较后,确定了这些无功能基因(又称为假基因)在人类基因组的确切位置。有趣的是,科学家们还发现,上述33个假基因中的10个似乎与编码嗅觉感受器的蛋白相关,这就有助于解释为什么人类的功能性嗅觉感受器较少,从而导致了人类的嗅觉比啮齿类动物差。axel和buck不久前就因在嗅觉分子生物学方面所做出的杰出贡献而获得了2004年诺贝尔生理学或医学奖。
然后,科学家将这33个假基因和黑猩猩的基因组序列草图进行了对照比较,以确定这些基因在大约500万年前类人猿进化为人类前是否还是有功能的。分析结果显示,33个假基因中的27个在人类中和在黑猩猩中均无功能,但有5个假基因虽在人类中无功能,但在黑猩猩中还是有功能的。美国休斯顿baylor医学院人类基因组测序中心主任gibbs说:“对这些人类基因组中的假基因以及黑猩猩基因组中仍有功能的对应基因的确定,为将来的研究项目打下了坚实的基础。”gibbs等目前正在进行另一种非人类灵长类动物——恒河猴基因组的测序工作。
参加绘制人类基因组图谱的美、英、日、法、德、中6国科学家2月12日公布了更加准确、清晰、完整的人类基因组图谱。这是在去年完成“工作框架图”的基础上,经过整理、分类和排列后得到的。明天,国际权威科学刊物《自然》将以60多页的篇幅刊登题为《人类基因组的初步测定和分析》的学术论文,对图谱绘制中的许多发现和数据进行介绍。这是人类首次全面介绍人类基因组工作框架图的“基本信息”。据悉,《自然》杂志网站已提前发布论文。同一期杂志还将发表多篇相关论文,涉及人类基因组图谱的绘制方法、染色体端粒图谱、Y染色体图谱、生殖细胞形成过程中染色体交换基因序列的方式、人体单核苷多态性数据等,公众可以在互联网上免费取阅有关原始数据。
基因研究起源于孟德尔遗传规律的发现
20世纪初孟德尔遗传规律的重新发现,激发了人类探索遗传信息的价值及内涵的兴趣。在过去的一百年中,这些探索极大地推动了生物学的发展。科学家将这些进步分为四个阶段:
第一阶段是遗传的细胞基础——染色体的发现。 第二阶段是遗传的分子基础——DNA双螺旋结构的提出。 第三阶段是遗传的信息基础的提出。科学家发现了细胞读取基因中信息的机制,借助重组DNA技术,可以同样读取基因中的信息。 第四阶段是测定一个基因乃至整个基因组。这一努力已取得丰硕的成果。到目前为止已经测定了599种病毒与类病毒,205种自然存在的质粒,185种细胞器,31种真细胞,7种古细菌,一种真菌,两种动物与一种植物。 二十世纪八十年代早期,对人类基因组计划就形成了两个重要共识:全面认识基因组可以极大地加速生物医学研究,可以使研究人员全面地、没有偏差地解决问题。1990年美国能源部与国立卫生院启动这一计划,英国、法国、日本也建立基因组中心开展研究。九十年代后期,人类基因组计划加速,德国和中国相继加入这一计划。中国是1999年9月加入这一国际协作组,负责测定人类基因组全部序列的1%,成为参与这一计划的惟一发展中国家。 人类基因竟然与老鼠蝇虫有许多相似之处
科研人员曾经预测人类约有14万个基因,但新的研究却将人类基因总数锁定在2.6383万到3.9114万个之间。也就是说,人类蛋白编码基因总数只是线虫和果蝇基因数目的两倍,只是基因更复杂些。人类蛋白质有61%与果蝇同源,43%与线虫同源,46%与酵母同源。人类17号染色体上的全部基因几乎都可以在小鼠11号染色体上找到。数百个基因可能是由细菌在脊椎动物进化的某个环节水平转移而来的。 在人类基因组上大约1/4的区域是长长的、没有基因的片段。基因密度在第17、第19和第22号染色体上最高,在X染色体、第4、第18号和Y染色体上相对贫瘠。另有35.3%的基因组包含重复的序列,第19号染色体57%是重复的。染色体中心粒旁与端粒附近区域存在大量的近期片断性重复。男性减数分裂的突变率是女性的两倍,染色体的远端及短臂重组率较高。研究还发现,地球上人与人之间99.99%的基因密码是相同的。来自不同人种的人比来自同一人种的人在基因上更为相似。在整个基因组序列中,人与人之间的变异仅为万分之一。 过去10年来,科学家们已绘制出40余种物种的基因组图谱。人类基因组是第一个精确测定的脊椎动物的基因组,也是目前为止测定的最大基因组。比以前测定的任何一种生物的基因组都大25倍以上,是以前测定所有基因组总和的8倍。这是人类自身的基因组信息。
绘制生物医学研究的元素周期表
基因只占人类DNA的很小一部分,但却代表着人类基因组的主要生物学功能。绘制人类基因组图谱最终的目标是编译出全部人类基因及其编码的蛋白清单,使之成为生物医学研究的元素周期表。基因可以分为编码RNA的基因以及蛋白编码基因,工作框架图是确定人类基因组中心蛋白编码基因。 人类基因组计划为医学进步带来空前机遇,对医学将产生不可估量的、深远的影响,将导致疾病的分子机制的阐明,进而根据这些机制,设计出诊断与治疗的方法。 人类基因组图谱最重要的应用之一,就是将许多生物化学功能未知的疾病基因定位。人体23对染色体由约30亿个碱基对组成,包含数万个基因。找出30亿个碱基对在DNA链上的准确位置,进而识别分析出各种基因及其功能,将使人类最终征服癌症、心脏病、阿尔茨海默氏症等多种顽疾。目前科学家通过克隆的方法,至少定位了30种疾病基因,利用基因组的数据,一些常见的染色体缺失综合症的机制将得以揭示。随着下一步对人体各种致病基因展开全面大搜索,以及对各种基因功能及基因之间相互作用了解的加深,科学家们将在分子水平上深入了解疾病的根本发病机理,将为各种疾病的诊断、防治和新药的开发提供有力武器。了解全部人类的基因与蛋白还可为寻找合适的药物靶点提供便利。此外,人类基因组计划的推进,将会促进生命科学与信息科学、材料科学等相结合,带动一批新兴高技术产业的发展。
树起探索生命奥秘的新里程碑
人类基因组工作框架图是一个动态的产品,数据每天都在更新,终极目标是绘制完成图。国际协作组将人类基因组计划分为两个阶段,第一阶段是在2000年6月完成的“工作框架图”;第二阶段目前正在进行,即在2001年绘制出人类基因组的完成图。这一任务进展迅速,人类基因组大约有32亿碱基,已经有10亿碱基的序列达到了完成图标准。尽管要绘制完成图还有很多工作要做,但这些信息已经可以使人们对人类基因组有一个总体的认识。 人类基因组图谱初步分析结果是人类探索生命奥秘这一伟大工程的新里程碑,为本世纪人们全面了解这些信息的奥秘奠定了基础。中国科学院院士、我国“863”计划生物技术领域首席科学家强伯勤教授认为,这“说明生命科学已经发展到了更深的阶段,它将推动基因组测序工作、功能基因的研究和基因技术的应用,从而推动整个生物技术的发展,也将对科技发展、经济发展以及整个社会产生深远影响。”据预测,在未来10至20年里,科学家还将解读大量生物的遗传密码,与此同时,还要完善全部人类基因与蛋白质的清单,对调控区域进行大规模的研究与分析等,基因组研究重点将进入确定基因结构与功能等应用研究阶段,生命科学因此将迎来新的大发展。
1、人类基因组精确图谱将成为21世纪生命科学领域的领头学科,这一点在国际上已得到认同,我们今天站在新世纪的门槛上,回想20世纪初,物理学在自然科学领域占绝对的领导地位,那时候的物理学如此风光,源于它在理论上的重大突破,牛顿力学、热力学第二定律、量子力学以及随后的相对论等等这些理论,给物理学的发展、物理学的冒尖打下了基础,这些理论是过去没有的,是人类创新性的理论,这就是物理学能在20世纪初成为自然科学领头学科的最根本的原因。此后,物理科学雄心勃勃,要把自然科学中的其他学科兼并,如量子力学把化学兼并,化学成为物理学的一部分,相对论诞生后,天文学成为物理学的一部分等等几乎所有的学科都被物理学兼并。物理学还有一个雄心壮志要把生命科学兼并,众所周知,著名的物理学家薛定谔撰写的“生命是什么”一书,影响久远,他意图用物
理学的理论与技术,把生命科学兼并,但最后没有成功,因为,物理学与生命科学在本质问题上存在三条鸿沟:第一条是生命现象具有遗传性、动态性,而物理学现象没有,物理学的结局就是平衡、静止,一个物体抛出去,给它一个动能,它可以滚动,但结局必然停止;第二是条生命现象具有目的性,它的结果决定了生命过程,比如人到一定时候必然死亡,人在生命过程里必须体现一些生理的特征,动物也有它的规律,这是生命现象的目的性,而物理学不是,物理学是初始条件决定它的结果;第三条,生命现象最重要的特征之一,是具有整体综合性,生命现象是整体综合的结果,而物理学是各个部分、各个事件简单的叠加,所以,这些基本的生命现象决定了物理科学不可能把生命科学兼并掉。所以,本世纪中期形成了物理科学与生命科学两足并立的局面,本世纪后半期,生命科学开始形成气候。大家知道,50年代的DNA双螺旋结构开辟了分子生物学的新时代,随后70年代的基因工程,80年代疾病机理的研究(如肿瘤机理的研究,单克隆抗体在医学上的应用),90年代基因组的研究,把生命科学在一个深层次上推向了一个新的高峰,人类基因组就是生命科学里的体现生命现象最根本性的机理,或最根本性的基础这样一个学科或这样一个课题,是生命科学的最前沿。人类基因组研究将带来生物学的一个新的飞跃,将比物理学的影响更大,因为物理科学阐明的是物质活动的规律,而生命科学中的人类基因组研究将要阐明的是人类最复杂的生命信息的运用规律,两者截然不同,人类基因组研究带给我们各方面的影响要大大超过物理学在本世纪初的影响。2 人类基因组精确图谱给我们带来什么?人类基因组研究将给我们带来认识生命现象的新观念、新方法、新途径,这对于搞科学研究的人来说是至关重要的,对哲学指导自然科学研究也同样重要。
人类基因组研究给我们的新观念是从整体上看待基因组的建构、现象和功能。众所周知,在遗传学家提出基因后,很长时间不知基因为何物,自上世纪遗传学家提出基因的概念后,40年代知道基因的化学本质,50年代知道基因的结构,90年代,大家都在研究基因,医学最感兴趣的是哪个疾病与哪个基因有关,很长一段时间里,在医学界形成了这样一种线性思维模式,比如肿瘤学家致力于寻找某种肿瘤的致癌基因,研究二者关系和基因表达的高与低,这样的研究持续了二三十年,后来大家发现,这样永远不可能得出正确的结论,因为疾病是复杂的,是整体综合的结果,而不是单纯的一对一、线性的关系。这不能不引起我们反思,目前在科学界,仍沿用西方的还原论,是还原论统治认识论,而疾病恰恰是综合的,必须用综合的方法来认识。著名肿瘤学家、诺贝尔奖获得者杜伯克认为这样研究肿瘤行不通,必须在基因组的总体水平上研究,一对一的线性思维研究模式不行,线性思维方式在方法论上的一个最大特点是作坊式研究,一个实验室一个实验室分别在作,一个人一个人在做实验,零打碎敲,所以杜伯克提出,先把人类基因组搞清,其他问题便可迎刃而解。1986年,他正式发表文章,现在称之为人类基因组计划(HGP)的第一份标书,主要解决两个问题:(1)方法论,即在整体综合上解决量的问题和质的问题,过去的还原论不符合现在的整体论研究,方法论上必须有根本改变,量不再是作坊式研究方式产出的量,而是批量化生产,把实验室变成车间,变成工业化、自动化。现在,在欧美等发达国家,基因组实验室就是一个车间,数据批量生产,全部自动化,一个技术员可管几百台机器,从全面的角度分析生命过程。从质上,从质量上,从本质上改变过去那种单干的方式,不再是联系某个疾病同某个基因或某个基因同某个生命现象的关系,而是研究这些相关基因网络的作用,作用就是功能,这就是本质。所以人类基因组研究从方法学上更注重网络作用的研究,人类基因组研究由过去单一的线性思维向综合性分析思维转变,在方法学上,专业的说法叫高通量,即批量生产,大规模、网络化,因此,方法学的改变引起了工业革命、科研革命,并带来一系列的连锁反应,数据一批批出来,而人工分析是不可能的,一切都要在计算机上解决问题,成批生产出来的数据就是生物信息,这些生物信息的处理用人工方法是无法解决的,计算机信息学方法可帮助我们分析问题。生物信息学在下世纪将引发信息爆炸,知识爆炸。人类基因组研究给我们最大的启发是从哲学角度来思考问题,给我们观念上的冲击和全新科研方法的促进。(2)认识论,前些年生命科学的其他学科如生理学、病理学、病理生理学等学科抱怨,好象有一条不成文的“条文”,向国家申请基金必须含有基因的工作和分子生物学的工作,否则很难申请到基金。众所周知,学科的发展有一定的规律,自然科学,从分类学到形态学再到遗传学,这是历史发展的必然规律,从研究的方法途径来说,就是解剖学、细胞学、分子学,把遗传学与分子学的方法结合在一起,就是分子遗传学,分子遗传学就是分子生物学,现在的学科前沿就在此,如果抱住传统的、经典的学科不放,那只有死路一条。21世纪,如果你的研究不在基因层次上,细胞层次,整体层次,结构与功能关系层次,基因型与表现型层次,信号传递与效应层次上进行多学科交叉,工作将很难开展。现在的趋势很明显,各国都把HGP作为21世纪初科技发展战略的首要任务。
去年我们在美国开中美21世纪生物医学发展战略研讨会的时候,当时NIH的院长瓦莫斯(因发现癌基因而获诺贝尔奖)在会上提出了21世纪初NIH发展的4个重点领域,即:(1)功能基因组学;(2)生物信息学;(3)重大疾病的机理和防治研究,针对美国来说,感染性疾病(艾滋病)是美国的重点;(4)医学中的伦理学研究。
3 人类基因组精确图谱真正会给我们带来好处多还是坏处多。据我的经验,HGP研究将给我们带来诸多好处:(1)无限的商机、无限的科学发展的光明前景,将给人类健康、保健带来福音;(2)HGP研究同任何其他科学研究一样,它是双刃剑,就是潘多拉魔盒,有利有弊,但利远远大于弊,利有以下几点:我们可以把HGP比喻为基础设施,一个现代化的城市,基础设施是非常重要的,城市的基础设施不好,城市就要瘫痪,城市的功能就不能很好地发挥,HGP研究就是生命科学的基础设施,用科学的语言就是遗传背景,遗传背景包括两个含义,一个是遗传硬件,另一个是遗传软件,硬件就是基础设施,就好像城市中的街道、建筑物等,没有硬件,软件无法应用,有硬件无软件功能发挥不了,软件就是把设施转化为功能,HGP的硬件就是草图,序列的框架图和全序列图,就是6月26日6个HGP共同宣布的人类基因组的全序列草图、框架图,这样的框架图是看不懂的“天书”,我们现在的工作是要把它变成看得懂摸得着的功能。
所以,HGP研究首先看得见的是效益,效益包括两个方面,一是科学上的效益,它帮助我们了解疾病发生的机理,HGP研究让我们对疾病的概念有一个全新的改变,即人类所有的疾病都是基因病,这个观点再次把遗传学推向前进一步,经典的遗传学只是注意到这个东西遗传给它,并不能从分子水平上说明它的机制,而现在基因组研究把遗传学推向一个新的层次,这叫基因学,也就是说,我们可以把人类所有的疾病都看成是基因病,基因病分单基因病、多基因病、获得性基因病。单基因病有6 000多种,属遗传上的疾病,相对说来认识较多,搞清其机理比较容易一些。多基因病有肿瘤、心脑血管病、高血压、糖尿病、风湿症、精神神经疾病等目前人类解决不了的疾病。获得性基因病有艾滋病、乙型肝炎等病原微生物感染所致疾病。目前国际竞争多在多基因病这个层面上。搞清任何一种疾病的易感基因(或致病基因)不仅可以帮助了解该疾病发生机理,也可为研究其他疾病相关基因提供借鉴。疾病发生机理主要包括基因机理和基因后机理,也就是说,任何疾病的发生首先直接或间接通过基因环节,然后经过基因外环节,即病理生理或病理过程,一直到形态、表型改变,所以了解疾病的基因机理是至关重要的。通过基因了解发病机理,为认识疾病作出贡献。二是可以马上变成经济效益,社会效益,HGP特别受瞩目源于此,人们的争论点也在此。因为HGP的最终目标就是为了人类健康,提高生存质量,也就是说,一个基因只要对健康有益,就有用,一个基因就是一个治疗和预防的方案,一个基因就是一个靶子,就可变成一个治疗方案,医生就可以根据基因的功能设计治疗和预防的方案。另外靶基因可变成药品,设计制药,筛选药物。现在药物基因组学非常看好,药物基因组学一方面可根据某个基因的功能来生产药物,另一方面可根据这样一个基因在不同个体的多态性来设计个体化治疗。比如人体内存在一类叫p450的混合功能氧化酶,任何外界的药物,化学物进入机体后,第一步经p450活化变成活性物质,再进行下一步的作用,由于p450具有多态性,它在不同个体作用不一样,所以每个个体对药物或化学物的反应性亦不同,这就是为什么同一药品在一个人有效,而在另一个人无效 的重要原因。HGP研究能提供许多这样的信息,根据这些信息来设计、实施个体化治疗。人类基因组本身是一个技术平台,它的主要表现形式就是遗传信息、生物信息,这些信息可变成光、电、颜色、各种看得见摸得着的信号,这样产业化便可进行,材料工业可根据基因组的信息发展纳米技术、生物材料、生物芯片,发展组合化学,这些都是在药物、临床等应用很广的产业。随着21世纪HGP的进展,可以说,一个基因就可变成一个朝阳产业。现在已有这样的先例,在国外,如果哪个基因与信号传导有关,那么它的一系列产品就接踵而来,信号传递过程中涉及许多靶点,每个靶点都可设计药物。所以基因研究的潜力很大,不像彩电,一经饱合,就不再有发展的余地。我们提供的许多生物信息,为新的能源的研制提供依据,电子信息的集成度有一定限度,而生物信息的集成度更大,生物计算机在21世纪必然要取代电子计算机。生物信息可数字化,可以影响到社会的一切领域,将来基因组的信息可以转化成数字。21世纪医学是基因组医学,每个人都有一个磁盘,记录他的遗传信息资料,医生可根据当时当地情况,结合他的遗传背景,给他一个提示,一个预报,医生看病必须改变现在经典的模式。如果临床医生对基因组知识不懂或懂的少,对未来医学的发展很不利。
人类基因组图谱既然与人类的生存、生活、健康关系如此密切,凭借人的聪明才智,完全可以把基因组图谱的信息转变为对人类生存、生活和健康有利的资源,使其取之不尽,用之不竭,造福人类,延绵不断。所以,今天当我们已经看到基因组图谱给人类照射进希望的曙光时,有理由相信,21世纪将是基因组学占主导地位的生命科学世纪。基因组学研究大致可分为两个大阶段:结构基因组学研究和功能基因组学研究。20世纪90年代开展的国际性大科学工程“人类基因组计划”属结构基因组学研究,进入21世纪后,功能基因组学研究将成为研究和竞争的焦点,这是因为一旦知晓基因组表达谱和基因的功能,即可很快过渡到基于基因谱和功能的开发、应用研究,直到解决临床上的各种棘手的难题和人们的生存、生活和保健的问题,如环境问题、营养问题、防病问题等等。由于上述研究和应用涉及广泛的理论、技术和资源问题,又可带动数、理、化、天、地、生、信息、材料、环境、农业和医学等等学科领域的发展。正因如此,我们几乎可以说,21世纪必将是抢基因的世纪和基因应用并造福于人类的前景辉煌的世纪。也正因如此,不仅发达国家,而且在某些发展中国家,在制定21世纪科技发展战略时,无不把人类基因组研究作为优先的主攻领域加以重点投资和支持,以便占据21世纪科技的一个制高点,至少应从功能基因组学研究造就的成果这块“蛋糕”中分享到一块。君不见,泱泱科技大国美国一马当先,正雄心勃勃要继续在21世纪的基因组图谱这块领地独占鳌头。请看克林顿总统在给国会的科技发展报告中为美国描绘的21世纪科技发展宏图即可见一斑,这份题为“塑造21世纪的科学和技术”的发展战略报告确定了美国21世纪科学研究的5个主攻领域,其中之一为“通过基因图谱研究推进医疗”,这一主攻领域的目标就是“帮助科学家从基因角度了解疾病、健康(如生长和发育)过程以及免疫系统是如何辨别外来入侵者的,一旦发现了一种疾病的基因基础,科学家就有可能将其击败”。所以,基因组图谱在判断遗传危险度、基因诊断、治疗和预防等方面将直接给人类带来好处。有人估计,21世纪基因组学还势必形成“朝阳产业”,直接参与市场经济活动。
既然基因组图谱研究展示了如此美好的前景,我们还犹豫什么?
4 人类基因组(图谱)和基因是天然的、客观的存在,不管你喜欢不喜欢,也不论你如何看待它。基因组给你什么?给我什么?给他什么?这个答案现在已经有了:基因组给了我们大家一个遗传背景。遗传背景有什么用?说来话就长了,简要地说,从大的方面说,它作为遗传信息的载体,采用信息控制的机制,规定了我们人类只能是人类,而不是别的什么动物或植物或微生物。所谓“种瓜得瓜,种豆得豆”或“龙生龙,凤生凤,老鼠生儿打地洞”,就是各自的基因组起的作用。从小的方面讲,人的生、长、老、病、死都与基因组表达图谱密切相关,能说它不重要?
不过,对于人,遗传背景好象“即明即暗”、“即近即远”。“即明、即近”者为:当今已知道人群中存在遗传异质性,分解到每一个人,遗传背景都有或多或少的差异,这种差异使每个人对环境因素(化学的、物理的、生物的)及心理因素的反应性(敏感性)千差万别,比如说,你容易患感冒,他不容易患;你吃药很见效,他吃同一种药则无效,等等,例子很多。由此即可见,基因组图谱研究与人类的生存、生活和健康的质量关系甚大,在某些情况下起关键性作用。但是,在现在,基因组图谱这个遗传背景在相当大范围内仍奥秘重重,迷雾层层,所知尚少,其庐山真面目尚需相当时日才能显露,此即“即暗即远”。因此,为了人类自己,研究基因组图谱实乃盛世之举,长远之举,明智之举。
问题也不少。最大的一个问题是:天然存在的人类基因组来自何方?是进化而成?还是上帝造物主的杰作?医学哲学家和自然辩证法专家应作何种思考?生物医学家应作何种论证?
5 基因组图谱在表现生命现象时虽然起关键性作用。任何生命现象归根结底都是遗传与环境相互作用的结果。生命的演绎过程就是各种复杂的因素在遗传背景这张天幕上表演情节复杂的“戏剧”过程,很精彩。遗传是内因,环境因素是外因,外因通过内因起作用,二者彼此依存。请看,基因组图谱把难懂的辩证法解析得如此清楚,科普到如此明白。
所以,在谈论基因组图谱和基因的作用时,切忌走极端。过份夸大基因的作用,甚至作无限制的推测和引申,容易跌入“基因决定论”泥潭。反之,如若否认基因的重要作用(关键作用),则容易跌入“基因无用论”和自然虚无主义陷阱。
还须指出,“基因决定论”的孪生姐妹就是“基因歧视”。这对错误的孪生基因论,由于为希特勒种族灭绝政策提供过“理论依据”,造成了历史大灾难,因而受到了历史的批判。但是,基因学家应当高举科学旗帜,在更高层次上用科学来说话——完全可以理直气壮地说,根据现已掌握的知识,在基因组层次上,人类只有一个共同的基因组,人与人之间是完全平等的。每个人的基因组所包含的10万个基因中,总会有个别或少数基因属于“脆弱的”或“不正常的”基因,不论是谁,概莫能外。当然,由于某些不可预测的复杂因素的影响,少数人的“脆弱的”和“不正常的”基因不幸得以表现,结果是生病、残疾、缺陷。这不是他们的基因的不是,而是他们的运气不佳,各种不良因素在他们身上起了作用。真正的辩证法并不否认这样的事实:在地球这个生物圈中,为了保持整体的生态平衡,人类绝对不许也不可能处于单向压倒强势。病患者、残疾者、缺陷者实际上承担了人类在自然界中应当承担的“负荷”,他们是替全人类受病患之苦,理应受到全体无病患的人们的同情、理解和照顾。试想一下,如果他们不患病,也许你我的“脆弱的”和“不正常的”基因会轮到表现。所以,在基因这一层次上,人们“以心比心”就是批判基因歧视的最有力武器。
相对而言,“基因无用论”的市场要小得多,因为科技的进步一再证明,基因是多么的重要。基因无用论已经苍白无力,站不住脚了。
6 随着人类基因组图谱研究的深入发展,以及鼓励公众最大限度地参与,相关的伦理道德、法律和社会问题正引起人们的关注。基因组研究的最终目标是使人类得到最大的利益,特别是与健康有关的利益。而由于基因组研究中不断涌现的新信息、新技术、新疗法、新药物和新观念等等新事物,在一定时期内还难以判定其利弊优劣,在采用它们或研究它们时,必然涉及道德、法律和社会问题,例如:基因组遗传信息的隐私权问题,基因诊断、治疗和预防中的安全性问题,对涉及基因组的知情权及知情同意权问题,并由这些问题引发出来的保险权、工作权、继承权、生育权等等问题。如何保证基因组图谱研究不损害人们的利益或把损害程度降低到最低程度呢?通常可采取两条途径:一是伦理规范、舆论监督,二是法律法规规范。
良心是最有效的伦理规范。良心需要不断培养、纯化和升华。对于一个事业心特强和好奇心特强的基因科学家来说,有时有可能“走火入魔”,做出不合伦理道德的事,故需要舆论监督和法律法规的规范。
另有一类基因组研究显然超出伦理范畴,这就是基因武器的制造。针对一定民族基因组多态性的特点,有可能制造出专门灭绝该民族的基因武器。这在理论上和技术上是成立的。我们反对这种尝试。但是,世界之大,狂人疯人总是存在的,也许有人已经在进行这种新型武器的研制。不过,以我之见,核武器也好,基因武器也罢,在科技高度发达和发展的今天,以及国际间科技信息交流的日益快速,这些厉害的新武器主要只起到一种威慑力量的作用而已。试想,如果你有基因武器,我也有能力制造,结果只能是谁也不敢首先使用,一旦有哪个战争狂人胆敢使用,恐怕他自己的命运也好不了。
基因武器涉及国家安全,与每个人的安全密切相关,应从战略高度来考虑这个问题。在基因组研究中,尽管伦理、法律和社会问题多多,这不能成为基因组研究的桎梏。我们应当坚信,人类出于生存和生活的本能和理智,在任何科技活动中会按一定的程序进行并经常调节自己的行为,不出乱子,这是主流。
转基因食品,福兮?祸兮?
民以食为天!基因技术首先瞄准的是人们的吃喝问题。人们不仅要吃得饱,还要吃得好。
曾经看到一幅漫画:转基因西红柿柜台前人山人海,因为这种西红柿中转入了预防乙肝的疫苗,而传统的西红柿则无人问津。图解传达的信息是,转基因食品能把防病和营养结合起来,真正做到吃饱、吃好和防病,一举多得。
瑞士已经捷足先登。他们把水仙的几种基因植入水稻,使得后者的含铁量增高,从而使得人们在吃饭时就能有效地吸收铁质。此外,植入的外来基因还可以提高水稻中维生素A的含量。目前全世界共有24亿人以稻米为主食,其中约有1.3亿人因缺铁而引起贫血,有4亿儿童因缺乏维生素A造成视力减退,严重者甚至双目失明。如果推广食用这种富含铁质和维生素A的转基因稻米,将大大降低发展中国家人口贫血症和维生素A缺乏症的发病率。
转基因食品的正式称谓是“遗传改造食品”(Genetically Modified Food,GM食品)。在这些食品大量问世之时,欧洲人却对这些具有外源性基因的食品产生了畏惧感,认为它们会对人类造成巨大灾难。
更为严重的是,围绕转基因作物的研制、生产和销售,印度曾在1999年发生一次生产商与消费者之间的冲突。当时美国孟山都公司准备在印度的两个试验地培育“雄性不育”的转基因作物。当地农民闻讯此事,误以为转基因作物“雄性不育”也会将不育传染给食用者。使人们患上“不育症”,让他们断子绝孙,这可是大不敬的事情,难免农民们会大动肝火,采取焚毁试验地的极端行为。
转基因食品究竟会不会对人产生有害的副作用,科学界目前对此尚无定论。不过,英美等国的多项研究已经表明,它可能使人过敏和损害生物的免疫系统。关于转基因食品的争论恐怕一时难以平息。
不久前拟南芥基因图谱的破译使人们发现,植物(作物)本身就已经包含了几乎所有改良食物的功能基因,包括抗病虫害、高产、美味和优质的基因等。科学家提出了新的设想:与其利用那些令人恐怖的、还不能确保安全的外源性基因,还不如使用作物自身包含的各种功能基因,这样一则简单易行,二则非常安全。
疾病与健康,基因说了算?
类基因组图谱的完成,立刻让人想到——癌症、艾滋病、糖尿病、早老性痴呆症等各种不治之症能否被降服?科学家认为,基因研究的深化有利于疾病的治疗、预防和新药开发,因为人类的大部分疾病都可以从基因上找到根源。从某种意义上说,只要找到长寿基因,也就找到了长寿的秘诀。
癌症是较为典型的基因病。已知癌症与X性染色体、22号染色体、3号染色体等上面的许多基因有关。然而,基因本身还具有多样性和复杂性。癌症就是多基因调控疾病,它是致癌基因与抑癌基因两种因素此消彼长、相互作用的结果。现已发现的致癌基因有bcl-2、C-myc、ras基因等,抑癌基因也有多种,现在研究得比较多的是P53基因。
科学家曾认为,如果能开发出抑制bcl-2基因和促进P53基因的药物,那么治癌甚至防癌就大有可为。发现致癌基因固然是治疗癌症和研制药物的基础,但导致癌症的真正原因要复杂得多。现在一般认为,环境,包括家庭环境、社会环境和自然环境各种因素,如家庭不和睦、工作单位人际关系不好、心理压力大、精神紧张、环境受到污染(如空气受到工业污染物的严重污染)、饮食受到杀虫剂和工业制剂的污染、生活习惯和规律(如吸烟饮酒)等等,都可能促使基因变化,致癌致病。
丹麦、瑞典和芬兰的科学家对450O0对双胞胎(9万人)进行的癌症发病率的研究说明,在癌症发病中,基因所起的作用只占30%左右。这项研究发现,双胞胎里有一人患上癌症的约占双胞胎总数的18%,两人都患癌的约为3%。数据分析表明,基因对前列腺癌的影响最大,在这种癌的发病中,基因的发病因素占42%;其次为结肠癌,基因致病因素占35%;再其次是乳腺癌,基因致病因素占27%。
健康和疾病除了基因外,也依赖于我们自身的行为和环境。把一切归于基因是一种片面,否定基因作用则是一种虚无。这正是人类基因组给予我们的认识。
人类基因组测序工作的基本完成,也使不少人把长寿的希望寄托在基因上,并预言只要找到了长寿基因,人类就有可能活到5O0岁,等等。然而基因组破译的结果也告诉我们,基因的形成和进化是稳定而自成系统的,它们有着适应进化的自组织系统。一种功能基因并非单独发挥其功能,而是与其他基因甚至基因序列的“荒漠部分”(即所谓的“多余”序列)共同起作用。
人的基因组存在一个基因与所有基因的平衡制约关系,或牵一发而动全身的关系,如果仅仅想要依靠长寿基因就能使人长寿则过于简单。有研究证明,把线虫身上的衰老基因进行调拨,以求让其长寿,结果倒是让线虫延长了寿命,但是其生命毫无质量,长期处于昏睡中。因此,基因不仅与长寿相关,也与生命质量相关,同时基因与基因之间更体现了平衡与制约。这种结果提醒人们,健康与长寿的钥匙仍然掌握在每个人自己的手上,而不仅仅是基因。甚至在调控基因时,也要全盘考虑所有基因和相关基因的作用。
因此,基因调控、合理膳食,适量运动,戒烟戒酒,心理平衡是健康、美丽和长寿的五大基石。
人类基因组、动物基因组和植物基因组的破译,使得大哲学家罗素关于“参差多态乃是幸福的本源”的论断在生命领域得到全新的阐释。
研究表明,人类目前还只能“读出”人类的生命密码,离“读懂”生命的密码还有很长的距离。尽管这次公布的人类基因组图谱表明人与人之间的共性极大,差异极小(99%的基因相同,仅1%的基因相异),但也正是这种极小的、被称为“单核苷酸多态性”(SNP)的差异导致了生命的多样性。
研究人员已经鉴定出了约210万个人与人之间不同的SNP。正是这种微小差异使人们认识到疾病诊断与治疗的个性化和参差多态。人们的许多疾病都是多基因控制的,或以一种基因为主,或多或少牵涉其他基因。也许这就是个体之间的基因差异或SNP,也因此在生活中,同样诊断为糖尿病,一个人用药有效,而另一个人用药则无效。探讨原因,除了要考虑环境、心理和生活方式等因素外,SNP是一个必须考虑的内因中的内因。这样,解决问题的方式可能是,未来的药物研究、疾病治疗应该是因人施治,因人用药,尽管疾病是一样的。
同样,从反面来思考SNP,也有可能完全解决器官移植的排异问题,比如同一个体的干细胞培养。其实事物和人们生活永远贯穿着多样性的基本哲理,比如孔子的因人施教,只是基因给了我们更深更多的诠释和深入的引导。
人类面临新的“哈姆莱特难题”
尽管疾病、健康和用药要充分利用基因多样性的原则,但在社会生活中,公正、平等和理性却是人类的另一种原则。也因此基因成果和基因多样性使人们产生了深深的忧虑。早就有很多人担忧基因歧视,因为一旦一个人的基因隐私被他人知道,他的入学、就业、保险、婚姻和个人生活等就会面临危险,所以有人高呼,“拒绝知道基因”。然而这还不是最为可怕的事。
对于基因和基因工程,英国理论物理学家史蒂夫·霍金曾在不同场合多次提出,基因工程已使人类能够创造出在体能和智力上远远高于其自身的“超人”,由“他们”来统治世界也并非是一种幻想。因为“除非我们拥有完整的世界秩序,否则就会有人在某地设计出经改进的超级人类。”
后来在回答“生物医学家是否有权扮演上帝的角色,而且如果发展经改进的人类会不会对未经改进的人类造成重大的社会和政治问题”时,霍金再次强调,“我不是在主张人类基因工程。我只是说,这是有可能发生的,我们得考虑如何应付它。”中国从事人类基因组研究的科学家也同样对此表明了态度——人类千万不要扮演“上帝”的角色,显然,这里的“上帝”便是自然之道。
所有人担心的问题就是人类和生物最本质的自然之道——基因将被如何使用、怎样使用、被谁使用。从某种意义上看,基因组的研究成果只不过是人们打开了潘多拉的盒子或拾到了一个烫手的山芋。如何使用基因成果,正是眼下人类社会面临的“哈姆莱特难题”,它是人类在基因时代无法回避的重要课题。