更新时间:2024-08-10 23:17
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(Next-generation sequencing technology),或大规模平行测序(Massively parallel sequencing,MPS)。区别于传统Sanger(双脱氧法)测序,能够一次并行对大量核酸分子进行平行序列测定的技术,通常一次测序反应能产出不低于100Mb的测序数据。
测序法已经成为一种常规的实验技术,不过最近新一代测序技术的显著优势,比如大规模平行信号(MPSS, Brenner et al.2000)和焦磷酸测序法(也称454测序; Margulies et al.2005, Langaee and ronaghi2005)已经使测序技术发生了彻底的变革,它们可以同时对数百万个短序列读长进行测序。
Sanger 等在20 世纪70 年代中期发明了DNA 末端终止法测序技术,他的发明第一次为人们开启了解读生命遗传密码的大门。此后测序法已经成为一种常规的实验技术,大规模平行测序的出现更是使测序技术发生了彻底的变革, 它们可以同时对数百万个短序列读长进行测序,从大规模平行信号测序(MPSS, Brenner et al.2000),到454焦磷酸测序法( Margulies et al.2005),illumina边合成边测序(sequencing by synthesis,SBS),SOLiD连接法测序,Ion Torrent利用离子敏感场效应晶体管检测pH值变化的合成测序法,华大智造联合探针锚定合成测序法(combinatorial probe-anchor synthesis,cPAS),大规模平行测序出现百花齐放的技术演化,使得科研人员能够以相对较少的经费获得海量DNA 序列。尽管面临着来自生物信息学方面的挑战,但是这些技术为探索更多生态学与进化问题提供了更多的机会,其中包括对生物多样性的分析( Venter etal.2004)。此外,二代测序技术是最不可能由于操作不当、缺失、稀有转录及克隆细菌不稳定的原因而产生错误的。技术进步使得这一方法变得不断可靠( Hamady et al.2008),绝大多数的转录表达(包括那些表达量极少的转录本)都能够被精准地定量( StoloⅦ itzky etal.2005)。随着序列读长的增加,大规模平行测序将被广泛应用于全基因组测序,全外显子测序,目标基因测序,转录组测序,甲基化测序等应用。
根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA 纳米球测序 (DNA nanoball sequencing)、联合探针锚定合成测序法(combinatorial probe-anchor synthesis,cPAS)等。
高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。
1.样本准备(sample fragmentation)
2.文库构建(library preparation)
3.测序反应(sequencing reaction)
4.数据分析(data analysis)
自从2005年454 Life Sciences公司(2007年该公司被Roche正式收购)推出了454 FLX焦磷酸测序平台(454 FLX pyrosequencing platform)以来,曾推出过3730xl DNA测序仪(3730xl DNA Analyzer)的Applied BioSystem(ABI)这家一直占据着测序市场最大份额的公司的领先地位就开始动摇了,因为他们的拳头产品毛细管阵列电泳测序仪系列(series capillary array electrophoresis sequencing machines)遇到了两个强有力的竞争对手,一个就是罗氏公司(Roche)的454 测序仪(Roch GS FLX sequencer),另一个就是2006年美国Illumina公司推出的Solexa基因组分析平台(Genome Analyzer platform),为此,2007年ABI公司推出了自主研发的SOLiD 测序仪(ABI SOLiD sequencer)。2010年Ion torrent公司(被ThermoFisher收购)推出了Ion PGM,2015年华大智造推出了BGISEQ-500测序平台,这5家公司构成了市面上主要的高通量基因测序仪制造商,并不断进行仪器的升级,推出新的测序机型。不过只有illumina,华大智造和ThermoFisher这三家的测序仪中部分机型进入了IVD市场(NMPA获批),其他公司设备主要应用在基础科研、公共卫生、分子育种、法庭科学等领域。表一列出了主流的高通量测序仪及相关参数:
表一:主流测序平台一览
Illumina Solexa 合成测序
(sequence by synthesis)
Illumina Genome AnalyzerIIx测序原理
Illumina公司的新一代测序仪Hiseq 2000和Hiseq 2500具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学 (基因表达及调控,基因功能,蛋白/核酸相互作用)研究。Hiseq是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时将基因组DNA的随机片段附着到光学透明的玻璃表面(即Flow cell),这些DNA片段经过延伸和桥式扩增后,在Flow cell上形成了数以亿计Cluster,每个Cluster是具有数千份相同模板的单分子簇。然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性终止的SBS(边合成边测序)技术对待测的模板DNA进行测序。
ThermoFisher Scientific半导体芯片测序
赛默飞的Ion Torrent平台采用乳液PCR法扩增连接在磁珠上的单个DNA分子,接下来磁珠结合到一个半导体芯片上,芯片包含一个独立的pH感应器晶体管,当磁珠上的DNA分子进行合成测序时,pH发生改变,晶体管通过pH的变化从而获得DNA序列信息。
MGI华大智造cPAS测序
(combinatorial probe-anchor synthesis)
MGI的DNBSEQ/MGISEQ系列测序仪,通过滚环复制将一个单链DNA环状分子扩增成DNA纳米球(DNA nanoballs,DNB)[14],再将DNB加载到芯片上。在DNB进行合成测序时,结合的核苷酸释放出的荧光被采集,从而读出DNA序列信息。这些测序仪已经被广泛用于临床样本的传染病测序。
Roche 454焦磷酸测序
(pyrophosphate sequencing)
该技术将固化引物的微球与单链DNA 相结合,构建DNA 模板文库,利用微乳滴PCR 来生成扩增产物。经过多轮循环,每个微球表面都结合了大量相同的DNA 片段。富集微球并转移到带有规则微孔阵列的微孔板上,每个微孔只能容纳1 个微球。微孔板的其中一面可以进行测序反应,另一面则与CCD 光学检测系统相接触。序列测定同样采用边合成边测序。三磷酸核苷结合到DNA 链上会释放出焦磷酸,此时通过荧光素酶和ATP 硫酰化酶产生级联反应会释放出光信号,利用该光学信号来进行检测DNA序列。
ABI SOLiD连接法测序
(sequence by ligation)
与454 类似,SOLiD 也采用微乳滴PCR 的方法扩增DNA 模板,并将扩增微球固定在玻璃基板上形成高通量的阵列。SOLiD 采用连接反应进行边合成边测序。将通用引物与连在微球上的DNA 文库模板杂交,然后进行一系列的连接反应。每个连接反应都发生在DNA 延伸链和带有荧光标记的单链八核苷酸探针池中的某一探针之间。八核苷酸探针的碱基与特定的荧光颜色有明确的对应关系。经过一系列复杂的连接,酶切和下一引物结合的反应循环后,获取荧光图象,即可根据碱基与荧光之间的对应关系读出DNA 序列信息。
测序技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行从头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。
这边需要特别指出的是第二代测序结合微阵列技术而衍生出来的应用--目标序列捕获测序技术(Targeted Resequencing)。这项技术首先利用微阵列技术合成大量寡核苷酸探针,这些寡核苷酸探针能够与基因组上的特定区域互补结合,从而富集到特定区段,然后用第二代测序技术对这些区段进行测序。提供序列捕获的厂家有Agilent和Nimblegen ,应用最多的是人全外显子组捕获测序。科学家们认为外显子组测序比全基因组重测序更有优势,不仅仅是费用较低,更是因为外显子组测序的数据分析计算量较小,与生物学表型结合更为直接。
高通量测序开始广泛应用于寻找疾病的候选基因上。内梅亨大学的研究人员使用这种方法鉴定出Schinzel-Giedion 综合征中的致病突变,Schinzel-Giedion综合征是一种导致严重的智力缺陷、肿瘤高发以及多种先天性畸形的罕见病。他们使用Agilent SureSelect序列捕获和SOLiD对四位患者的外显子组进行测序,平均覆盖度为43倍,读长为50 nt,每个个体产生了2.7-3 GB可作图的序列数据。他们聚焦于全部四位患者都携带变异体的12个基因,最终将候选基因缩小至1个。而贝勒医学院基因组测序中心也计划对15种以Science杂志年度十大科学突破上疾病进行研究,包括脑癌、肝癌、胰腺癌、结肠癌、卵巢癌、膀胱癌、心脏病、糖尿病、自闭症以及其他遗传疾病,以更好地理解致病突变以及突变对疾病的影响。前不久刚刚结束的评选中,外显子组测序名列其中。
以上我们盘点了2010年第二代测序技术的最新进展和相关应用。但是除了第二代测序之外,还有另外一种以单分子实时测序和纳米孔为标志的第三代测序技术也正在如火如荼的发展中,只是应用范围还没有二代测序广泛。所以科学界所说的高通量测序还指的是第二代测序。
高通量测序技术的诞生可以说是基因组学研究领域一个具有里程碑意义的事件。该技术使得核酸测序的单碱基成本与第一代测序技术相比急剧下降, 以人类基因组测序为例, 上世纪末进行的人类基因组计划花费 30 亿美元解码了人类生命密码, 而第二代测序使得人类基因组测序已进入万(美)元基因组时代。如此低廉的单碱基测序成本使得我们可以实施更多物种的基因组计划从而解密更多生物物种的基因组遗传密码。同时在已完成基因组序列测定的物种中, 对该物种的其他品种进行大规模地全基因组重测序也成为了可能。