更新时间:2023-12-24 17:59
Entrez 是美国国家生物技术信息中心所提供的在线资源检索器。该资源将GenBank序列与其原始文献出处链接在一起。 Entrez 是由NCBI主持的一个数据库检索系统。
它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。
Entrez中核酸数据库为:GenBank,EMBL,DDBJ
蛋白质数据库为:Swiss-Prot,PIR,PFR,PDB
PubMed
基因组和染色体图谱资料
检索领域:(Search Fields)
在WWW Entrez检索系统中,检索内容被分为许多小的领域,每一个检索领域包含以下信息:
进入(Accession):包含进入号
相关性(Affiliation):包括该检索领域建立时的相关信息,原作者地址,有时亦有其他作者地址
作者姓名(Author Name):包含文章作者清单。
E.C号(E.C.Number):是酶学委员会命名的酶的编号
特征词(Feature Key):描述DNA特征的关键词
基因符号(Gene Symbol):基因的标准名称。
杂志名(Journal Title):为检索条目第一次发表时的杂志名,该杂志名是以缩写形式储存于数据库中,如果不清楚杂志是如何缩写的可采用List Terms来查看。
关键词(Keywords):可以使用较特定的索引条目来检索以上数据库。类似于医学光盘检索。
Medline UID :是Medline对每一个条目给出的唯一识别标记。
MeSH主题词(MeSH Terms):包括 MeSH的主题词,下级主题词。
MeSH主要关键词 (MeSH Major Topic):为检索条目十分重要的MeSH词目。
修改日期(Modification Date):包含该条目进入Entrez的日期,与出版日期一样,以年/月/日形式出现
页数(Page Number):该文章所在杂志的页码。
特性(Property):一个或几个关键词,用来描述该序列的类型。
出版日期(Publication Date):包含文章出版日期以及序列录入GenBank的日期。
PubMed ID:PubMed对每一个条目给出的识别标记。
物种(Organism):包含与该蛋白或核酸序列相关物种的学名和俗名。
蛋白质名称(Protein name):
Seq Id: 与FASTA识别标记类似,为序列的一种识别标记
物质(Substance):与该条目相关的化学物质名称。
文字检索词(Text Words):包含文章中的所有词,其中:
Medline词目:标题和文摘
蛋白质词目:定义,评论,蛋白名称,蛋白描述
核酸条目:定义,评论,基因名称,基因名称
标题检索词(Title Words):在标题中出现的词,或在描述该条目时出现的词。
卷(Volume):刊登该文章杂志所在卷
使用Medline UID,PubMed ID和 Seq ID进行检索时,在栏目框中要输入数字。如要输入多个数字,中间要用空格或逗号隔开。并选择相对应的检索领域。
检索模式(Search Modes)
www Entrez可以采用几种不同途径的检索方式
名词列表格式(list term):当输入一检索词后,Entrez将列出与此相关的该领域中所有标准的检索词名称,此时,可选择一或多个标准名词去检索。
自动格式(automatic):当输入一个检索词后,即自动检索,如果输入的检索词超过一个,则Entrez会自动将之组合起来,如果无结果,则可尝试将这多个检索词用“ ”括起来。
阅读文献(Viewing Document)
每一个文件都可以有数种阅读方式,目的各不相同。一般来说,“引文格式(citation)”最适合于阅读Medline形式的文件;“GenPept” 格式适用于阅读蛋白质文件;“GenBank”格式用来阅读核酸文件。
阅读方式
可单一阅读,亦可成批阅读
对于PubMed文章:
引文(citation)格式:包含题目,文摘,MeSH主题词等
文摘格式:包含题目,文摘
ASN.1格式:文章以ASN.1格式出现
MEDLINE格式:文章以MEDLINE格式出现
对于蛋白和核酸文件:
GenBank/GenPept格式: 标准的GenBank或GenPept格式
Report格式:GenBank格式
ASN.1格式
图形格式(Graphic View)
对于结构文件:
结构总结格式:结构的基本信息,可以看三维结构
ASN.1格式:
对于基因组文件:
图形格式
ASN.1格式