更新时间:2024-01-16 17:31
CpG岛是生物学术语。CpG岛主要位于基因的启动子(promotor)和外显子区域,是富含CpG二核苷酸的一些区域,长度为300—3000bp。这里CpG是胞嘧啶(C)—磷酸(p)—鸟嘌呤(G)的缩写。
CpG岛(CpG island):CpG双核苷酸在人类基因组中的分布很不均一,而在基因组的某些区段,CpG保持或高于正常概率。约有60%以上基因的启动子含有CpG岛。CpG岛的GC含量大于50%,长度500~1000bp。
在哺乳动物中CpG以两种形式存在:一种是分散于DNA序列中;另一种呈现高度聚集状态,人们称之为CpG岛(CpG island)。在正常组织里,70%~90%散在的CpG是被甲基修饰的,而与之相反,大小为100-1000bp左右且富含CpG二核苷酸的CpG岛,则往往非甲基化的(注:定位于失活X染色体上的基因、印迹基因和非表达的组织特异基因的CpG岛是被甲基化修饰的)。CpG岛常位于基因转录调控区附近,与56%的人类基因组编码基因相关,因此基因转录区CpG岛的甲基化状态的研究就显得十分重要。人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1Mb就有5-15个CpG岛,平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系。
CpG岛经常出现在真核生物的编码基因的调控区,在其它地方出现时会由于CpG中的C易被甲基化而形成5'-甲基胞嘧啶,脱氨基后形成尿嘧啶,经DNA复制或扩增后转化为胸腺嘧啶(T),由于T本身就会存在于DNA中,因此不易被修复,所以被淘汰。故CpG在基因组中是以岛的形式分布的。
CpG岛,其中G在DNA链中紧随C后。在许多基因的启动子(promotor)或“起始”区域周围,甲基化经常被抑制。这些区域包含浓度相对较高的CpG对,与此段区域对应的染色体区段一起被称作CpG岛,其长度通常在几百到几千核苷酸的长度内变化。
许多基因,尤其是管家基因的启动子区,其中通常存在一些富含双核苷酸“CG”的区域,称为“CpG岛”(CpG island)。研究碱基G和C在整个基因组内的含量和分布有十分重要的意义。例如在人类基因组内,GC的含量大约为40%;这些GC并不是平均分布在基因组内,在某些DNA片段上其含量可高达60%以上,而在另一些区域则只有33%左右。这种GC含量的差别,在基因表达的调控和基因突变上都可能扮演着重要的角色。在人类基因组内,存在有近3万个CpG岛;在大多数染色体上,平均每100万碱基含有5~15个CpG岛,其中有1.8万多个CpG岛片段的GC含量为60%~70%。通常,这些CpG岛不仅是基因的一种标志,而且还参与基因表达的调控和影响染色质的结构。例如, 除定位于失活X染色体上的基因、印迹基因和非表达的组织特异基因(奢侈基因)外,正常细胞的CpG岛由于被保护而处于非甲基化状态。
全基因组低甲基化,维持甲基化模式酶的调节失控和正常非甲基化CpG岛的高甲基化是人类肿瘤中普遍存在的现象。以往的研究证明启动子区的高甲基化导致抑癌基因失活是人类肿瘤所具有的共同特征之一,而且这种高甲基化是导致抑癌基因失活的又一个机制。
另外,原核生物细菌DNA含有高频率的CpG双核苷,约为1/16,细菌DNA和某些含非甲基化CpG双核苷的多聚核苷酸能够刺激鼠和人淋巴细胞。高等脊椎动物出现CpG双核苷频率为1/50,且多为甲基化,真核细胞和甲基化的多聚核苷酸则不能刺激鼠和人淋巴细胞。CpG结构与细菌DNA同源性要高于脊椎动物细胞。CpG DNA可直接刺激B细胞、巨噬细胞和DCs细胞分泌细胞因子。特别是TH1样细胞因子如IL-12和 IL-18;细胞表达协同刺激因子分子,显示增强抗原递呈作用。CpG DNA可诱导强烈的TH1样应答提示这些分子可作为疫苗的佐剂,抵抗各种目标,包括感染性物质,肿瘤抗原,过敏原等。