更新时间:2023-07-27 15:53
* Scirus 是专门用于科技信息检索的世界上最全面的科技搜索引擎。 Scirus 与其它搜索引擎最大的区别在于,其既可以搜索网站(Web),也可以搜索期刊资源,而且专注于科技方面的内容。Scirus已于2014年初停止服务。
* Scirus可检索免费资源和期刊资源。涵盖超过1.05亿个与科技相关的网站,包括9,000万个网页,以及1,700万个来自其它信息源的记录,这些信息源包括:Science Direct, IDEAL, MEDLINE on BioMedNet, Beilstein on ChemWeb, US Patent Office, E-Print ArXiv, Chemistry Preprint Server, Mathematics Preprint Server, CogPrints和NASA等。
* 包括1280万条MEDLINE文摘;
* 160万篇ScienceDirect全文;
* 90万项USPTO的专利;
* 近66万篇Beilstein文摘;
* 近25万篇IDEAL全文;
* 10310篇NASA技术报告;
* 将近20万篇来源于E-Print ArXiv的电子文献;
* 1410篇来源于CogPrints的电子文献;
* 565种来自Mathematics Preprint Server的预印本;
* 820篇来源于BioMed Central的全文;
* 565条来源于Neuroscion的新闻;
* 465种来自Chemistry Preprint Server的预印
文献类型:论文、专利、技术报告、新闻等(文摘、全文)
学科领域:农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,经济、金融与管理科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,神经系统科学,药理学,物理学,心理学,社会与行为科学,社会学等
获取途径:免费浏览所有检索到的互联网主页的信息。Scirus提供的期刊资源可以免费查看题录和文摘。但是,获取非免费期刊全文需要预先注册并支付费用。
Scirus,除了其高级搜索的用户选项较多以外,它还使 用一个特殊的叙词表来收录相关的科学词汇。在与慕尼黑大学(University of Munich)的计算语言学系(Computational Linguistics Department)的合作基础上,Scirus确定了超过50,000个叙词,涵盖所有专业科学领域的科学叙词表,以保证检索效率。系统对每次搜索到 的信息内容会自动抽取反映主题内容的关键词,以列表的形式显示在搜索结果的右侧,点击列表中的某一个词,系统会自动添加到检索式中,对上一次的搜索结果再 实施一次限定检索,这对于缩小一项检索是非常有效的。若在检索词列表中没有所需的检索词,可在检索词列表下的二次检索框内输入检索词,进行二次限制检索, 以进一步提高搜索的专指性,这是一般的搜索引擎所无法比拟的。
Scirus通过高级检索,用户可以限定检索内容,达到更高的查准率
将查询结果限定在某一时间段内,Scirus提供的搜索范围从1920年起按照出版日期范围查询。此方法特别适用于查询最新的学术文献,如只查询2005年的文献等等
就 信息类型 (information type)查询。如科学会议、摘要、科学家主页及专利等八种类型 按照出版物名称查询。如果想对特定出版物查询相关主题,这是一个好方法;但是由于许多出版物有多种拼法,所以用户可能需要多试几次才能找到。如 Journal of Biological Chemistry经常会被缩写为J Biol Chem
就html或者PDF等文件格式(file format)查询。正如Scirus网页中所说的,大量的学术论文仅公布PDF格式文件,因而,PDF格式的文件的标引、检索对于一个专业的科学搜索引擎来说是至关重要的 按照作者查询。这是一个非常有效地获得专家文献的方法
就 内容来源(content sources)查询。用户既可以从期刊中,如Beilstein on ChemWeb、ScienceDirect中查询,也可以从NASA、US Patent Office的Web网页中查询所需信息 搜索词限于文章标题或者全文的查询
在一定主题范围(subject areas)内查询。包括:天文学、数学、物理、经济、法律等20个专业学科,学科的排列是按照字母顺序展开的 可选择页面显示搜索结果数量,每个页面显示结果最高可达100个
除了以上几种检索限定外,在高级检索中还可以结合上文所提到的字段限制(如题名、作者等)来进行查询
Scirus的检索结果
Scirus 为了能够精确地搜集相关的科学信息,它使用了倒置的金字塔技术来描述搜集过程。在过程中的每一个层次,数据都进行了严格地过滤。位于倒置的金字塔顶端的是 种子列表(Seed List),它是Scirus进行因特网搜寻信息的基础。在其中,有多种途径为种子列表加入资源。
Scirus使用一个机器人(就好像网络蚂蚁或爬虫一样)来读取在种子列表的信息。不像通用型搜索引擎,Scirus的机器人不会去搜寻资源的链接网页,除非种子列表中包含有其链 接的网页。这种做法主要是仅为科学资源做标引,以确保精确检索。举例来说,如果Scirus在对某网站进行搜索,那么这个网站链接到的谷歌网站则不会被搜索,因为谷歌网站不在种子列表中。
当机器人对种子列表进行搜索时,Scirus从所搜索的科学资源下载信息。然后将信息归类(classification)并建立索引(index)和等级(rank)以供用户查询使用。
为了保证检索结果的有效性,Scirus通过以下几种方式来显示检索结果:
■ 它合并一个网站下的多个相关的网页。尽管网页间的内容不一样,但是因为从属于一个网站下,所以很多网页的信息是非常相似的。用户如果在显示结果后点击“more hits from”,Scirus将会显示在同一网站下的更多的相关匹配结果;
■ 在检索结果中列明出处,以保证用户清楚地知道哪些结果是来自Web网页,哪些结果是来自数据库。如果我们检索结果中的文献信息来自BioMed Central,结果中除了给出文章的主题、作者、摘要等相关信息,还在末尾显示“full text article available from BioMed Central”;
■ 可以将检索结果保存及通过电子邮件邮寄到指定的地址。