走向整合 实现互联 面向知识服务的二次文献数据库

时间: 2007-07-30 00:00:00   文章录入: 系统管理员

走向整合 实现互联 面向知识服务的二次文献数据库

 

王国庆 张晓梅 陈建青 肖健

(解放军医学图书馆 北京 100039

 

摘要随着文献资源数字化进程的加快,数字图书馆的建设日趋成熟。大量全文数据库系统的广泛应用,使人们在文献资源索取和利用上更加快捷和便利。尤其是全文数据库将检索功能与原始文献有机结合融为一体,更是对二次文献数据库的作用、地位及价值形成了多方面的巨大冲击。本文在分析二次文献所处困境和发展现状的基础上,对二次文献今后的出路和发展提出了发挥自身优势,走向整合,实现互联,面向知识服务的发展思路。并对二次文献数据库建设的内容提出了具体的设想和要求。

 

关键词二次文献数据库;一次文献数据库;全文数据库;资源整合;开发链接;知识服务

 

分类号

 

1.辉煌的过去

二次文献是科技人员从浩如烟海的文献洪流中,快、全、准地查到与课题有关资料的重要工具。它是将大量分散无序的一次文献进行加工、提炼、组织并按照一定的逻辑顺序或科学体系加以编排起来的相关文献的集合。二次文献也称作检索工具,其主要类型有目录、题录、索引、文摘等。

在传统的图书馆文献服务中, 二次文献一直是读者查找馆藏和信息获取的首选工具。二次文献无论从任何角度讲, 它在图书馆史和文献资源利用史上都占有重要地位,可以说它是伴随着图书馆的产生而出现, 也随着图书馆的发展而发展。在我国, 二次文献的编制工作最早见于汉代的刘向、刘歆编制的《七略》和《别录》。随着图书馆事业的发展和人们利用文献信息资源的需要增加, 二次文献也得到发展, 各种大型的二次文献检索刊物也相应出现, 如美国的《化学文摘》《工程索引》《医学索引》, 英国的《科学文摘》, 日本的《科学技术文献速报》以及我国的《全国报刊索引》《中文科技资料目录》等著名的二次文献。

随着技术的发展二次文献数据库也都经历了从纸介质、磁介质到网络传输的过程,它们都在发展自己,不仅仅是跟随技术发展迎合用户的需求,更主要的是在一个特定的领域让人们不断去体会它们的价值所在。美国的医学泰斗William H. Welch 曾经指出:十九世纪美国对医学有四大贡献:麻醉术的发展,昆虫传播疾病的发现,现代公共卫生实验室的建立和军医署图书馆的发展及馆藏索引目录的编制,他认为这最后一项是这四大贡献中最重要的一项。军医署图书馆馆藏索引目录,就是现在美国国立医学图书馆的《医学索引(IM)》二次文献的前身。

 

 

2.严峻的现实

二次文献的编辑、利用曾经伴随着图书馆和文献资源的利用走过了它辉煌的过去。但随着文献资源数字化进程的加快,数字图书馆的建设日趋成熟。大量全文数据库系统的开发与投入使用,使人们在文献资源索取和利用上更加快捷和便利。尤其是全文数据库将检索功能与原始文献有机结合融为一体,更是对二次文献数据库的作用、地位及价值形成了多方面的巨大冲击。

 

2. 1 检索作用的价值受到冲击

二次文献的出现和广泛使用, 就在于它具有强大的检索功能, 它可以帮助用户快捷、准确地获取一次文献。因为一次文献的数量非常庞大而且分布又处于无序状态,所以离开了目录、索引就无法获取原文。但随着计算机技术的快速发展, 数字化全文检索系统的开发与广泛运用,

文献资源的数字化使浩瀚的文献实现了集中,过去的“文、检分离”实现了一体化, 一些开发比较成熟的信息系统本身就提供了强大的检索功能, 因此使得二次文献的检索导读功能的作用受到质疑。学术刊物类的如CNKI、维普数据, 图书类的如超星数字图书馆、书生之家等, 它们本身就具有强大的检索功能, 人们不必先通过什么单独的书目、索引等二次文献作为检索工具查找资料, 只需要通过简单的计算机操作就能快速获取自己满意的文献信息资料。二次文献的检索价值受到了冲击。

 

2. 2  快速获取业内最新信息的优势减弱

二次文献的应用使得用户可以快速获取最新信息资源;瞬息扫描、浏览成千上百种的期刊文献;并能即时捕捉用户所需的特定专业文献资源。全文检索技术在全文数据库中的应用,使得二次文献的这一优势明显减弱。

 

2.3弥补原始文献索取障碍的功能已逐步弱化

二次文献的另一个重要功能是帮助人们在原始文献不足的情况下, 满足用户的基本信息需求, 二次文献中的文摘在此方面的作用尤为突出。过去, 人们在获取文献信息时受到地域的限制, 获取原始文献特别困难, 特别是一些外文资料的获取。通过邮寄一是要花很长时间, 二来还需要大量的资金, 因此只能通过一些二次文献来获取部分信息, 以满足基本需要。如他们通过《化学文摘》和《科学文摘》等工具书获取一些摘要性的内容, 满足一些基本需要。但是随着全文数据库的开发, 原始文献的获取变得非常容易, 即使是外文资料的获取也是相当的容易。因此利用二次文献来满足信息需要的功用也大为减弱。

 

2. 4  二次文献的简洁便利性不复存在

全文电子库没有出现前,读者总是要翻阅大量的书本原始文献,而阅读二次文献就显得非常简洁便利,可节约不少时间。全文电子库的出现使得用户无论是阅读全文还是阅读文摘都非常方便,大家查找阅读文献不再需要二次文献作中介,不用先查找什么书名目录之类的检索工具就能得到自己需要的资料。因此数字全文检索系统的广泛运用动摇了传统的二次文献的地位。

 

2. 5  作为获取信息首选工具的作用基本丧失

过去人们为了查找信息, 首先想到的是二次文献, 唯一可依赖的也只有二次文献。而随着数字化的发展, 人们获取信息的习惯正发生深刻的改变,二次文献的使用不再是他们的首选, 他们首先考虑的是使用哪种全文数据库。有人对用户利用文献资源的情况作过调查表明: 95 %的用户是直接从原文数据库中查找资料, 而只有5 %的用户还在利用二次文献作引导使用数字资源。而在这5 %的用户中, 大多数是老专家。他们过去长期使用这些二次文献, 对其编排格式、体例等非常熟悉。而另一些人则是冲着这些检索刊物的知名度而来的。用户获取文献习惯的改变, 必然会对二次文献利用产生重要的影响。

 

3.路在何方?

以上现象致使人们对二次文献的生存提出了质疑。甚至有人说二次文献没有意义了,最终要被一次文献完全取代的说法。对这一问题我们的回答当然是否定的。因为从文献的产生和发展过程来看,一次文献和二次文献所处的阶段、等级以及他们本身的质和量不同,因此在传递知识、信息的过程中所起的作用也不同。人们将一次文献收集整理加工为二次文献,不仅仅是为了揭示馆藏和检索导读,而还有着其极其重要的广而深、范而细的文献聚类和滤除歧义的功能(查新功能),这是一次文献再怎么发展变化也不可能取代的功能。从知识创新的过程(如图所示)我们可以看出:

 

科研活动=知识创新

科学家=情报专家

 

知识创新的过程

 

一次文献的提供为信息服务,二次文献的提供为情报服务,三次文献的提供为知识服务。其中二次文献服务起着关键性的作用,二次文献是知识服务、知识创新得以实现的重要工具。没有二次文献服务,信息服务和知识服务就很盲从,不是同类的一次文献无法查全,就是找到的文献准确度低从而影响三次文献的形成。很难想象在这个信息膨胀、文献泛滥的时代,没有二次文献的服务和保障,知识服务如何开展,知识创新何以实现。

 

31面向知识服务

既然二次文献对于知识服务和知识创新有着极其重要的作用,那么面对一次文献资源数字化、网络化发展带来的冲击与挑战,二次文献数据库的发展就必须充分发挥其在知识创新全过程的作用和优势,换句话说只有面向知识服务,倾心致力于知识服务的开拓与创新,二次文献数据库的发展才有出路。随着数字化、网络化日益深入,信息膨胀越发有增无减,知识服务就越来越显得迫切,目前知识服务已成为图书馆界的热门话题,但知识服务还处在探索和摸索阶段,甚至仅是概念上的炒作,具体实践仍有困难。这为二次文献数据库的发展带来了新的机遇。

 

32走向整合

二次文献数据库要面向知识服务,充分发挥促进知识服务的作用,首先要走资源整合之路,并且这种整合是全方位的。

3.2.1基于文献类型的整合

一个学科、主题的相关资源包括多种类型的文献信息,如专著、期刊、报纸、会议录、专利、标准、报告等一次文献,包括书目、索引、文摘等二次文献,还有百科全书、手册等事实数据型三次文献,以及日益丰富的网络资源。一个数据库的容量是有限的,只有开放的、实现与外部资源广泛、动态联系的数据库才是有生命力的。

3.2.2基于多种类型数据库的集成

近年来,文摘索引数据库的发展表现出规模化趋势,各大数据库商不断购买其他提供商的数据库或者整合一些免费资源,作为其原有内容的有效补充,旨在为用户提供一定范围内最全面的文献信息资源。而经过集成的数据库形成了一个相对完整的资源系统,整体大于部分之和,整合无疑使数据库实现了较大的增值效应。ISI Web of  Knowledge(http//wwwisinetcom)是集成各种数据库的典型代表。

ISI公司自身出版的数据库包括: Web of Science (包括SCISSCIAHCI三个引文索引和Current Chemical ReactionsIndex Chemi cus化学反应与化合物) ISI Proceedings(包括ISTPISSHP会议索引数据库)Journal Citation Reports(期刊引用报告)Current Contents Connect(现刊目次)

近年来,ISI公司先后整合:BP(生物文摘)INSPEC(科学文摘) DII(德温特专利索引) PubMed(美国国家医学图书馆),AGRICOLA(美国国家农业图书馆), ERIC(美国国家教育图书馆),arXiv(预印本全文库 )。

目前仅在Web of Knowledge平台上资源类型集合了期刊、会议、专利、报告和事实数据等多种信息源,而且各种信息之间的多向联系也得到了较为充分的揭示,形成了一个相互关联、互为参照、相互补充的各种学术信息资源的集成体系。

 

32.3基于不同全文数据库的整合

二次文献数据库资源广泛、数据量大,涵盖面广,而每个全文数据库能覆盖的科技文献内容与数量有限 ,通过二次文献数据库与不同全文数据库、出版商电子期刊全文的整合,使一次文献的获取便捷、及时,提高数据库原始文献的保障能力,实现数据库信息检索与原文获取的一体化,极大地方便用户。

3.2.4基于网络资源的整合

   因特网上可以免费利用的学术信息极其丰富,是商业数据库之外的一个重要信息源,然而由于网络信息内容纷繁芜杂,质量参差不齐,想要从中找到真正所需的可靠信息并非易事,再加上一般搜索引擎对资源的选择评价不足,因而难以满足学术研究对资源质量的要求。许多数据库商正在力图整合和揭示免费网络资源。

    目前数据库对网络资源的整合模式包括:一是选择、标引学术网络资源,并以统一平台提供与其他数据库的联合检索;二是提供专业搜索引擎的链接,一般而言,前一种方式中数据库的增值性更强。

3.2.5基于馆藏资源的整合

    二次文献数据库与馆藏OPAC系统以及联合目录进行整合。通过使用馆藏目录和联合目录检索馆目录信息,就可以直接链接到各图书馆的馆藏信息,然后根据自己的意愿,可以直接在本馆借阅,或者提供申请表链接经E-mail到馆际互借、文献传递部门获取原文。

3.2.6整合技术的综合应用

    目前实现资源的全方位整合已经不是天方夜谭,各种互操作的协议、标准、技术应用已经极为普遍、成熟,实现资源整合技术上已无障碍。但各种技术难分仲伯,各有优势。目前应该采取综合应用的模式全方位实现资源的整合。

 

3.3实现互联

    整合与互联互为一体,密不可分,整合是实现互联的基础,整合不是目的,只是实现互联的手段。实现互联是网络化、数字化发展的必然趋势。

     任何资源本质上都不是孤立的,没有一个数据库能够提供所有的信息与服务,数据库的互联有助于揭示各种信息的内在联系,实质是将自身置于信息服务的整体环境中,促进用户在多层次、多方位的发现与利用资源,体现了二次文献数据库检索功能之外的知识发现功能。总之,一个数据库的容量是有限的,只有开放的、实现与外部资源广泛的、动态联系的数据库才是有生命力的。实现互联主要是指二次文献与一次文献的直接链接,这种链接应该说也是全方位的。

3.3.1实现与馆藏文献链接

二次文献要实现与馆藏OPAC系统和联目的整合,但更重要的是与馆藏一次文献相链接,这样用户在利用本馆资源时,才能真正实现一站式检索和一站式全文索取服务。光实现与目录的整合。没有链接全文,只能是一站式检索而无法实现一站式全文服务。

3.3.2 实现与电子全文库的链接

利用各种开放式无缝链接的技术协议和标准以及中介服务代理实现二次文献与一次文献电子数据库的直接对接。使用户在利用二次文献进行文献查询时,能够实现授权刊或免费资源本地和异地一次文献的一站式获取。从而使二次文献数据库功能及生命力极大地提高。

3.3.3逐步实现全方位的知识连接

    二次文献库在整合各种类型文献资源的基础上,逐步实现全方位的知识连接很快就会成为现实。使得各种信息之间的多向联系得到了较为充分的揭示,形成一个相互关联、互为参照、相互补充的各种学术信息资源的集成体系。将来用户在利用二次文献数据库时,不仅仅是利用其检索功能,而且可以实现检索功能之外的知识发现功能。可检索大量的期刊、会议论文和技术报告外,亦可检索到权威的专利和标准文献。而且,既可以进行文献资源的查检,也可以进行专业术语的求解、作者资料的查找、相关网址的搜索等事实和数据检索。

 

34 打造理想化的检索平台

二次文献库有了很好的整合实现了全方位的互联,还必须要有一个理想化的检索平台来体现其价值和作用。网络环境下理想的系统检索平台应该是一方面要追求高检索效率,另一方面要注重新理念、新技术和新方法的吸收和应用,不仅具有较为完善的检索功能,而且具有较强的系统整合、个性化服务与管理功能、知识发现与增值服务的功能。

3.4.1 以用户为中心,不断优化、完善数据库结构检索功能,始终是数据库发展的个重要策略。

第一,根据不同层次用户提供不同的检索功能。为初级用户提供快速检索、简单检索入口。为专业用户提供高级检索方式,增加互动式词表索引、提供浏览式索引等,适应自然语言、受控语言(主题词、叙词)检索、分类浏览查询。

第二,检索字段设计灵活、全面。除提供文摘、关键词、著者、题名、刊名等基本字段外,还可提供专业术语的求解、作者资料的查找、相关网址的搜索等事实和数据检索。

第三,检索精确适合用户特定的检索需要。用户可以使用逻辑算符、位置算符、优先算符等进行扩检、缩检和精确检索,可以对数据库的文档、检索字段、出版时间、文献类型等进行检索选择。允许用户对检索结果进行多样化的处理。用户可对每屏的记录数进行限制,可以选择按检索结果的相关度、出版时间、文献标题、著者来源等分别进行升序或降序排列,可根据需要对检索结果进行各种操作,如二次检索、查看检索历史保存检索策略、创建邮件发送服务、直接存盘、打印以及原文链接、在线订购文献原文等。

3.4.2 个性化服务

个性化服务是体现数据库检索系统、功能和质量的标志之一,也是优化数据库的一个发展趋势,它不仅将个性化服务、主动性服务、文献检索服务有机结合了起来,同时也锁定了一些固定用户,增加了用户对数据库的了解和使用兴趣。二次文献库检索平台应能够通过建立个人帐户的方式,实现用户检索策略、检索结果、检索历史自动储存和随时调用;应用各种数据自动推送技术如RSS等,实现基于用户设定的服务种类、服务内容、服务时间、服务频率、服务通知方式等,将用户需求或定制的有用信息及时发送给用户,并实现自动更新;为用户提供专业咨询、信息反馈、文献传递等。这种以人为本的个性化主动服务节省了用户的检索时间和费用,最大限度地发挥数据库的效益,提高了资源利用率,真正做到了“以用户为中心”。

3.4.3 专题化制定

个性化服务提倡的是用户自己制定,平台自动发送。专题化制定要求我们主动为用户预先制定设立各种类型学科图书馆、专题数据库。用户可以根据自己的需求直接选择利用。平台同样提供与个性化服务一样的传送发送功能模式。

3.4.4 快速全文传递服务

二次文献库一定要力争实现直接快速的全文获取和传送通道,才能真正改变目前的困境。要及时通知用户全文获取的情况,最好的方式就是实现手机短信提醒功能;要让用户以最快的速度获取全文,E-mail传送当然是最好的方式,但实现用户手机下载阅读,应该是最快速的模式。相信实现全文获取的最好模式应该是手机短信提醒、手机收费、手机下载阅读。

3.4.5 实现知识服务

    二次文献库应时刻追踪新技术的应用,及时吸纳先进的检索功能与模式,不断探索新的理想化检索模式,逐步走向检索智能化,服务知识化。达到即使你不是专业研究人员, 也能得到专家级的检索结果。这就是知识服务。

 

3.4.6 实现知识增值服务

在技术发展和应用的基础上。主动了解用户深层次信息服务的需求,通过数据挖掘技术对数据进行更高层次的分析,开发智能服务,从数据中发现学科发展规律、研究热点核心作者等等,分析学术活动,预测学科未来的发展趋势。这种服务有利于用户更好地把握和评价该学科领域的研究成果的质量和研究者群体的水平,有利于用户更好地评价某一信息源的学术水平;有利于图书馆员向特定用户对象报道学科的研究热点增强情报服务的科学性和针对性;也有利于图书馆员进行学科发展预测,以提高图书馆服务的前瞻性提高服务水平与服务层次。

目前国内许多数据库系统都可以高效地实现数据的录入、查询、统计等功能,但仅仅提供对数据进行简单处理的功能,无法发现数据中存在的关系无法根据现有的数据预测未来的发展趋势。数据库建设必须适应用户需要,开发深层次知识服务,建设更高效用的知识处理模式,实现主动、积极的增值服务,这无疑将是二次文献数据库信息服务的又一个发展方向。

 

3.5 广泛的合作

    发展是硬道理,合作是必由之路。任何图书馆,任何数字化资源服务商,均不可能满足用户的所有需求。只有进行广泛的合作,实行强强联合,才能优化配置、优势互补,真正促进发展,方便用户需求。合作也是全方位的,技术的合作、资源的合作、推广应用服务的合作、同行的合作、相关行业的合作对于二次文献数据库的发展都是非常必要的。

4.结束语

  二次文献数据库正朝着信息内容的极大丰富、检索系统集成化、智能化、超强的全文链接和专业化、个性化、知识化服务的方向发展。它不仅不会消亡,反而会随着技术的发展突现其巨大的生命力。

 

 

 

 

参考文献

1.  韩丽风,杨毅,林佳.文摘索引数据库增值功能研究.中国图书馆学报,2005(5):45-49

2.  罗金增 从Ei Village 2看我国二次文献数据库的发展趋向. 数字图书馆论坛,2006(5):

3.    .基于Web的数字图书馆跨库检索系统的比较研究. 图书情报工作,2005,49(4):88

4.  朱兵,吕淑萍.Scopus看文摘和索引数据库的发展态势.农业图书情报学刊,2005,17(10):86

5.  肖大成. 二次文献在数字化进程中的生存危机与对策研究.图书馆理论与实践,2005(3):47

6.  刘鲁红. 走向互联的数字图书馆.情报学报,2005,24(3):346

7.  王泽琪. 文摘索引型数据库和全文数据库检索系统的比较. 图书馆工作与研究,2005(3):47

 

中华预防医学会预防医学情报专业委员会 版权所有
中国疾控中心信息中心提供技术支持与服务
建议使用 1024*768 分辨率,IE6.0以上浏览器