蛋白质序列数据库

更新时间：2022-08-25 12:40

蛋白质序列数据库指应用计算机功能分析生物学信息的数据库。应用计算机的运算法则，比较DNA和蛋白质序列而检测结构、功能和序列之间的进化关系。各种基因组的序列产生大量的DNA序列数据和生物信息，已经被应用于研究基因的功能，预测以前未知的基因功能。人们的注意力主要集中在从仅有的氨基酸序列预测蛋白质结构和功能。

历史追溯

由于蛋白质序列测定技术先于DNA序列测定技术问世，蛋白质序列的搜集也早于DNA序列。蛋白质序列数据库的雏形可以追溯到60年代。60年代中期到80年代初，美国国家生物医学研究基金会(National Biomedical Research Foundation，简称NBRF)Dayhoff领导的研究组将搜集到的蛋白质序列和结构信息以“蛋白质序列和结构地图集”(Atlas of Protein Sequence and Structure)的形式发表，主要用来研究蛋白质的进化关系。1984年，“蛋白质信息资源”(Protein Information Resource，简称PIR)计划正式启动，蛋白质序列数据库PIR也因此而诞生。与核酸序列数据库的国际合作相呼应，1988年，美国的NBRF、日本的国际蛋白质信息数据库(Japanese International Protein Information Database，简称JIPID)和德国的慕尼黑蛋白质序列信息中心(Munich Information Center for Protein Sequences，简称MIPS)合作成立了国际蛋白质信息中心(PIR-International)，共同收集和维护蛋白质序列数据库PIR，[Barker等, 2000]。

列数据库

序列数据库是生物信息数据库中最基本的数据库，包括核酸和蛋白质两类，以核苷酸碱基顺序或氨基酸残基顺序为基本内容，并附有注释信息。注释信息包括两部分，一部分由计算机程序经过序列分析由计算机程序生成，另一部分则依靠生物学家通过查阅文献资料而获得。序列数据库从一个侧面反映了信息资源的传播从印刷品到电子媒体再到网络的发展趋势。

资源PIR

PIR(Protein Information Resource)由佐治棠大学建立，网址：http://pir.georgetown.edu，是一个蛋白质信息学的公共信息源及支持服务于一体的资源网站。它致力于基因组学和蛋白质组学的研究及科学探索。该蛋白质序列数据库的雏形可以追朔到60年代。1966年美国国家生物医学研究基金会(National Biomedical Research Foundation，简称NBRF)Dayhoff领导的研究组将搜集到的蛋白质序列和结构信息以《蛋白质序列和结构地图集》(Atlas of Protein Sequence and Structure)一书的形式发表，主要用来研究蛋白质的进化关系，该书到1979年已出版了5版和3个增补本后不再有新版。1984年，“蛋白质信息资源”(Protein Information Resource，简称PIR)计划正式启动，蛋白质序列数据库PIR也因此而诞生。1988年，美国华盛顿的乔治城大学全国生物医学研究基金会(NBRF)、日本东京理科大学的日本国际蛋白质信息数据库(Japanese International Protein Information Database，简称JIPID)和德国的慕尼黑蛋白质序列信息中心(Munich Information Center for Protein Sequences，简称MIPS)三家实验室共同合作成立了国际蛋白质信息中心(PIR-International)，共同收集和维护蛋白质序列数据库PIR，PIR数据库按照数据的性质和注释层次分四个不同部分，分别为PIR1、PIR2、PIR3和PIR4。PIR1中的序列已经验证，注释最为详尽；PIR2中包含尚未确定的冗余序列；PIR3中的序列尚未加以检验，也未加注释；而PIR4中则包括了其它各种渠道获得的序列，既未验证，也无注释。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}