全文数据库包括哪些

小老鼠
小老鼠原创
2023-06-09 17:21:43202浏览

全文数据库即收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。全文数据库免去了文献标引著录等加工环节,减少了数据组织中的人为因素,因此数据更新速度快,检索结果查准率更高;同时由于直接提供全文,省去了找到原文的麻烦,因此深受用户喜爱。

本教程操作系统:windows11系统、Dell G3电脑。

全文数据库即收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。全文数据库免去了文献标引著录等加工环节,减少了数据组织中的人为因素,因此数据更新速度快,检索结果查准率更高;同时由于直接提供全文,省去了找到原文的麻烦,因此深受用户喜爱。全文数据库的数量扶摇直上,当前,全文数据库的数量与书目数据库的比例大约已达到2:1,而且数量仍然呈上升趋势。

数据库的结构定义,全文数据库的数据内容,全文系统中所用词表、存储空间的利用统计及调整。

分类

根据全文数据库中的信息内容呈现形式划分,全文数据库的类型主要有电子版图书、电子杂志、电子报纸等。

电子版图书一般与印刷版平行出版,并具有浏览、检索、排序、打印、套录等功能。电子图书可上网,提高了文献传输效率和文献的可获得性。电子图书的出现将改善(改变)人们的读书习惯。

电子杂志可使文献的检索同原始文献的获得结合起来。包含多期刊的全文库,可进行跨学科、跨刊种的全文检索,扩大获取资料的来源范围。由中国学术期刊(光盘版)

电子杂志社和清华同方光盘股份有限公司建设的中国学术期刊网(http://WWW.cnki.net),其中的中国期刊全文数据库收录的期刊3000多种,文献量600万余篇。

电子报纸把报纸文章和新闻报道通过数据库存储和管理,并可进行网上检索查询。《纽约时报》全文库Information Bank是这类数据库的先驱,后来被收入Mead数据中心的NEXIS系统之中。我国《人民日报》社和北京金盘电子有限公司合作发行的《人民日报全文数据库》光盘版,《中国日报》社和中国科技资料进出口总公司合作发行的《中国日报全文数据库》光盘版,是我国第一批新闻报业的全文数据库。

结构

全文数据库有多种结构形式。

一种结构是全文数据库由若干文库组成,每个文库划分为若干个文档,文档由若干信息载体组成,信息载体又细分为若干片断,片断指构成文本的自然段落,相当于字段。美国Mead数据中心的LEXIS就是这种结构。它是一个菜单驱动系统,一级菜单显示文库目录,二级菜单显示文档目录,待文库和文档选定后,系统开始接收提问。

另一种结构是全文数据库由若干个数据库组成,数据库下不设文档这一级结构,而是直接把信息载体分成字段存储。美国西部出版公司的WESTLAW就是这种结构,该系统中设有法院字段、审判员字段等,可提供多种检索手段。全文数据库结构与书目数据库相似,其主文档是以顺排形式组织的文本文件,倒排档则是对应于信息载体记录可检字段的索引文件。全文数据库记录的磁带格式一般也分头标、目次和数据部等几部分,在已有的全文数据库中,根据领域信息载体、数据库用户和设备的不同情况,采取不同的实现方法。

特点

与其他数据库相比,全文数据库有许多特点,主要表现如下。

①包含信息的原始性。库中信息基本上是未加工的原始文献,因而具有客观性。

②信息检索的彻底性。任何词、句、字皆可检索,还有可能看到某些边缘性信息。

③检索语言的自然性。可使用自然语言检索,并可使用布尔检索和位置检索,因而要涉及自然语言的理解。

④数据结构基本上是非结构化的,除了某些可规范的数据外,大量文本属于非结构化的,不便于关系数据库的处理。

⑤专业的全文数据库系统一般都采用“自动切词”技术

⑥好的全文数据库还备有知识库,可具有推理能力和联想式检索。

⑦基本上是封闭性的,数据不需更新,具有较大的稳定性。

⑧全文数据库一般占用的存储空间非常庞大,系统开销大,如何提高检索速度是一大难题。 [2]

以上就是全文数据库包括哪些的详细内容,更多请关注php中文网其它相关文章!

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。