更新时间:2022-08-25 12:18
广域信息服务(wide area information service;WAIS)是因特网提供的快速信息查询服务工具。它是一种能查询 500 个检索数据库的工具 ,所涉及的话题十分广泛。
WAIS允许用户在Internet网中查询和访问数据库中的任何信息。同样WAIS采用客户一服务器模式。用户提供所需查询的关键词,获取服务器中相关的数据。服务器通过一些统计关键词的启发式算法,选择一系列文件列表。用户可以根据这些列表向服务器获取文件的内容;也可以继续通过关键词细化查询;甚至可以将整篇文章返回服务器要求按文查找与此相关文件。据统计,Internet上WAIS服务器超过400个,大都提供基于文本资料的搜索。美国国会会图书馆也提供基于WAIS的信息服务。
使用WAIS时,首先从服务器的资源中选择有必要搜索的一个或多个数据库,然后提供关键词。服务器将返回包含关键词的文件列表。每一个文件都有一个0到1000的相关分数.粗略表示文件与所查询的的符合程度,并以分数对文件排序;同时还列出文件的字节数。
参考ISO/OSI模型,WAIS实际上是应用层协议,WAIS协议分为四个部分:初识化,初始化响应,查询,查询响应,与Gopher不同,协议基于二进制模式。每一个APDU由一系列不定长的域构成,每个PDU的第一个字节表示PDU的长度,同样每个域的每一个字节表示域的长度。这样,协议双方就可以顺序获取每域的内容。根据APDU第二字节的类型说明,可以确定该属于哪一种APDU。
由客户程序发出的初始化(Init APDU)操作主要为了与服务器建立连接,可能有一些系统设置的数据,比如信息长度,最大记录等等,并没有用户数据。
服务器接到Init APDU后,返回响应(Init—Response APDU),其中包括接受连接的状态,服务器接受的信息长度+最大记录等.除外还有用于标识高亮(highlight)的控制符。
用户给出关键词后,客户程序再发出查询(Search APDu)操作,不仅包括用户所给出的关键词,还有用户指定的所需查询文件的数目。
服务器根据Search APDU,在数据库中进行搜索.并把所得结果按相关分数降序排序。返回的响应(Search Response APDU)中包括各个文件的文档号,版号,相关分数,文件长度,标题,来源等等信息。客户软件据此转化为合适的格式显示给用户。
WAIS最适合基于关键词的文本信息查询,但是,WAIS并不是一个通用的信息检索工具,不能提供超文本链结功能,对于非文本文件,只能查询文件名。由于WAIS没有遵循SQL标准,因此不能与其它数据库交互。