INTERNET专业数据库比较研究
摘 要 通过对几个主要交通运输数据库的比较,研究了目前INTERNET上专业数据库的发展情况,并提出了改进的对策。
关键词 INTENET 专业数据库
数据库建设是信息社会的一个重要组成部分,是方便有效地为社会提供信息的重要渠道和不可缺少的工具。专业文献数据库的特点在于它的数据专业性,所采集的数据比较集中地反映出该专业领域研究的全貌。专业人员通过对它的检索可比较方便和全面地掌握该研究领域的文献线索,从而对他们的工作提供有益的帮助。本文选择中国交通数据库、TRIS ONLINE、ASCE CEDB三个国内外比较重要的交通运输专业在线数据库进行比较评价,以管窥我国目前的INTER-
NET专业数据库的现状,并得出相关结论。
1 三个重要的交通运输在线数据库及检索功能
中国交通数据库由交通部科技信息研究所生产和更新,拟将囊括国内交通方面的各种数据库。初期由五个数据库组成:中国公路运输文摘、中国水路运输文摘、国际道路研究文献(1993年以后ต)、国外交通网站指引库、国外水运数据库运输文摘。
TRIS数据库由美国运输部赞助,美国National Academies of Science下属的运输研究局负责生产和维护,其数据库是世界上最大的交通运输书目数据库。TRIS ONLINE将TRIS绝大部分数据直接送上因特网供人们检索使用。
ASCE(美国土木工程学会)是世界上最大的土木工程信息的出版者,ASCE CEDB则是囊括ASCE所有出版物的书目数据库。
一个数据库就是一个完整的检索系统,对数据库的评价就应该以其检索功能为主要评价指标。这三个数据库的容量和检索功能的比较见表1。
表1 交通运输在线数据库的容量和检索功能比较表
TRIS ONLINEASCE CEDB中国交通数据库网址p>
gov/trisp>
org/cedbsrch.html
database/db.htm数据库容量425 000条80 000条303 664条覆盖范围运输航空、建筑、桥梁、公路、运输等25个土木工程专业领域公路运输、水路运输提供的数据题录、文摘、全文(部分)题录、文摘题录、文摘检索收费免费免费收费检索字段题名、文摘、关键词、组织机构或团体作者名称、作者、刊名或会议名称、文献号、出版时间作者、题名、常用关键词、任意字段、出版时间、文献类型文献类型、流水号、分类号、作者、题名、出处、出版日期、页次、母体类型、主题词、参照词、文摘员、索取号、文摘布尔检索符And、or、notAnd、or、notAnd、or截词检索符*、?*无词组检索有有无词表禁用词表;运输研究词表(TRT)常用关键在线词表;禁用词表交通主题词表排序输出按出版时间按出版时间按出版时间在线帮助详细一般暂无获取全✞文方式通过Uncover公司、美国西北大学运输图书馆文献传递服务;指引到相关站点获取原文;复制;网上书店在线订购原文;馆际互借网上书店在线订购;订阅期刊;文献传递服务暂无检索界面表格形式,界面友好,简单易用表格形式,简单易用表格形式,不易用2 国内外专业网络数据库比较分析
2.1 国内外专业网络数据库容量与服务方面的差别
以我国网上交通运输专业数据库为例,我国专业在线数据库集成化程度不高,小库多而分散,如交通运输方面就有航空周刊数据库、造船文摘数据库、汽车信息数据库、航空基金研究成果库、中国公路运输文摘数据库、中国水路运输文摘数据库等,各个数据库的学科覆盖面均有限,因而很难从根本上提高数据库的容量,较重要的中国交通数据库就比TRIS ONLINE少近30%的记录量。
在提供服务方面,国内外专业网络数据库服务着眼点不同,即营利点不同,造成国内外专业网络数据库在服务方式上的极大差异。如国内交通运输数据库多采用会员制,在检索时收取费用,不是会员享受不到完整的服务或被拒绝进入数据库的主页,门槛高、友好性差。而在国外,交通运输专业数据库生产者至少采取以下几ฃ种营利方式:将数据库出售给联机数据库中介服务商、在网站上刊登广告、获取文献全文时的服务收费。这些数据库生产者的站点通过全面开放数据库,提供免费的数据库检索服务,有的还不断增加全文信息(如TRIS ONLINE),吸引用户反复多次使用其数据库达到营利目的。
在获取全文文献时,国外普遍采用了先进的网络服务手段,如开设网上书店、实施文献传递服务(Docu-
ment Delivery Service,简称DDS)等。国内在文献原文提供方面,缺乏必要的手段,即便是在网页上设置了这一栏目,也往往是没有下文,形同虚设,这在很大程度上制约了网络数据库服务质量的提高。
2.2 国内外专业网络数据库检索功能之比较分析
首先,数据库生产者的数据库检索功能没有联机数据库的检索功能强。除了布尔检索、字段检索、截词检索等常见的检索功能外,如交通运输专业数据库生产者的网站检索系统一般不具备联机数据库的一个重要检索功能——位置检索,位置检 ツ索可以深入到原文的每个细节,增加选词的灵活性,把满足检索者要求的词间关系的文献检索出来,提高查准率。
其次,现在多数检索系统都可以使用表格形式进行字段检索,但各个检索系统具有的检索字段不同。如中国交通数据库将字段分得很细,有14种之多,ASCE CEDB虽然只有几个检索字段,但其中却有任意字段,即将检索词在全文范围内进行匹配,只要在全文中任何地方出现该检索词,文献即为检索命中文献。这种全文检索是全文检索系统所特有的功能,它对提高查全率,特别是对检索前沿性的课题信息极为有用。中国交通数据库通过对文献进行主题标引,使用户可较为准确地检索到所需要的主题资料。用主题检索语言进行检索具有较高的查全率和查准率,但标引阶段费时费力。多数检索系统在自然检索语言与受控语言的选择上意见不一。国内的一些专业数据库一般按专业主题词表标引文献,国外的专业数据库采用自然语言机器标引者居多,而本文讨论的TRIS ONLINE则选择了从自然语言向受控语言转换的做法,TRIS自1999年1月起,以Transportation Research Thesaurus作为TRIS的受控词表标引文献,并逐步把TRIS ONLINE的索引转换成TRT术语,以TRT为检索工具。另外,目前检索系统的检索结果的输出方式一般都是按出版时间排序输出,多数尚未实现按相关性排序输出。
最后,一个好的检索系统既要满足一定的查全率、查准率,又要尽量简化检索句法。检索界面要清晰、有层次,给用户更多的选择,并做到每一种检索功能、每一个层次的检索操作都设置实时帮助按钮。同时要设置在线词表,帮助用户确定检索策略。我国的ツ检索系统的在线帮助内容缺乏,造成用户对检索句法和规则理解不准,影响了检索结果的准确性和全面性。
3 结论
参考文献
1 郑志军.网上中文数据库的现状与改进.情报杂志,2000
(2)
2 黄美君.大型网络电子期刊检索系统的比较研究.图书情报工作,2000
(7)
3 赖茂生, 徐克敏等编著. 科技文献检索. 北京大学出版社,1994