现在位置:范文先生网>教学论文>综合教育论文>《中国分类主题词表》WEB数据库建设

《中国分类主题词表》WEB数据库建设

时间:2023-02-20 10:16:05 综合教育论文 我要投稿
  • 相关推荐

《中国分类主题词表》WEB数据库建设

  【内容提要】本文介绍了《中国分类主题词表》WEB数据库采用微软公司ASP与SQL  SERVER2000的集成技术开发研制,论述了《中国分类主题词表》WEB数据库建设的必要性,选用的软件、建库的重点及检索的途径。
【摘  要  题】信息化与网络化建设
【关  键  词】中国分类主题词表/WEB数据库/ASP/SQL &nbs
  1994年正式出版发行的《中国分类主题词表》(以下简称《词表》)是在《中国图书馆图书分类法》第3版(含《中国图书资料法》第3版)和《汉语主题词表》基础上编制的大型分类法,是一部集分类、主题为一体的综合性工具书。它从内容到形式、从结构到语义等方面,实现了分类语言与主题语言、先组语言与后组语言的相互兼容。该表实现了经一次主题分析,通过标引数据的转换,同时完成分类标引和主题标引,因而降低了标引难度,提高了标引质量,节省了人力和物力;便于分类检索和主题检索以及有分类号、主题词和自然语言三者组成的混合检索,实现了分类检索和主题检索的互补,提高了检全率和检准率。
  ASP技术可以简便易行地实现构建Web数据库的查询程序,它集简单与高效于一身,可以非常直观地开发出复杂的Web应用,基于ASP开发的《中国分类主题词表》Web数据库具有良好的交互式使用方式,将有助于它在中国各类图书馆、文献情报机构中普及使用,大大地提高图书分类的准确度与效率,对我国图书情报机构文献管理和图书情报服务的现代化具有深远意义。
    1 《中国分类主题词表》电子化的必要性
  我国分类主题一体化的发展趋势在很大程度上取决于《词表》的出版和使用。由于《词表》的广泛使用,推广了主题工作、提高了主题标引的质量,为文献标引工作提供了权威的标引依据。但是,随着科学技术的发展与社会的进步,面对先进的网络技术、计算机技术在图书馆广泛应用的前景,标引人员不仅要求《词表》能满足新学科、新技术、新主题文献标引的动态需要,还呼唤能实现各种文献信息的自动标引或智能标引,满足各种用户包括读者在内的文献信息检索需要,实现自动检索或智能检索。
  实现自动标引的基础是用于标引的词表库。系统标引词表库是自动标引系统辅助标引人员寻找合适的分类标识、主题标识和标识间相互转换的依据。由于《词表》完成了分类法类目与主题词或主题词串的对应,使得文献分类标引和主题标引同步进行变得易于实现,因此《词表》为标引词库表的建立奠定了坚实的基础。
  电子化的《词表》首先摆脱了计算机编目中的分类主题手工标引,充分利用Microsoft  SQL  Server为基础建立起来的大型数据库应用程序,系统界面友好、操作简便,计算、分析、检索功能非常强大,提高了标引质量,节省了人力。其次也解决了由于外在因素带来的使用上的不便,比如印刷版《词表》价格高,一般图书馆只买一部,至多两部,而中型以上的图书馆从事文献标引工作的人员不少于两人,《词表》作为必备的常用工具书,就明显不够用,尤其是在回溯建立馆藏文献数据库时,情况更为突出,严重影响了工作进度。又如《词表》体积大,作为标引人员随时都在翻阅的工具书,就显得十分笨重和不方便,不到一年就破损严重。以上种种原因表明,电子化的《词表》是十分必要的,也只有将《词表》电子化、网络化,才能充分发挥它所蕴藏的多种潜在功能。
    2 《中国分类主题词表》WEB数据库建库软件
  《中国分类主题词表》的数据量比较大,数据库有20多万条记录,要有相应快的响应速度,并且需要支持多人同时访问。SQL  Server  2000能满足以上要求。以CⅡ800的计算机为例,检索21万条记录的数据库只需要6秒。
  2.1 SQL  Server  2000完全的Web支持
  SQL  Server  2000提供了以Web标准为基础的扩展数据库编程功能。丰富的XML和Internet标准支持允许使用内置的存储过程以XML格式轻松存储和检索数据。还可以使用XML更新程序容易地插入、更新和删除数据。SQL  Server  2000具有强大的Web访问功能,使用HTTP可向数据库发送查询、对数据库中存储的文档执行全文搜索以及通过Web进行自然语言查询。
  2.2 SQL  Server  2000高度的可伸缩性和可靠性
  使用SQL  Server  2000可以获得非凡的可伸缩性和可靠性。通过向上伸缩和向外扩展的能力,SQL  Server满足了苛刻的电子商务和企业应用程序要求。向上伸缩。SQL  Server  2000利用了对称多处理器(SMP)系统。SQL  Server  Enterprise  Edition最多可以使用32个处理器和64  GB  RAM。向外扩展。向外扩展可以将数据库和数据负载分配给多台服务器。可用性。通过增强的故障转移群集、日志传送和新增的备份策略,SQL  Server  2000达到了最大的可用性。
  2.3 ASP技术的使用
  ASP是Active  Server  Pages的简称,它是一种在微软公司的WEB服务器IIS(Internet  Infomation  Server)上开发交互网页的新技术。微软公司最初在IIS3.0版上使用它以取代CGI。随着Windows  NT在WWW上的使用日益增多,ASP已经成为了开发动态网站、构筑Internet和Intranet应用的最佳选择。
  如果你的计算机上装的是Windows  NT  4.0,那么你可以通过安装NT的可选包WindowsNT  Option  Pack  4.0来安装IIS4.0,然后你就可以在IIS4.0里使用ASP了。如果你的操作系统是Windows  98,那么你可以在Win98光盘里找到一个ADD-ONS目录,下面的PWS目录里面有一个小型WWW服务器软件PWS(PersonalWeb  Server),它也可以支持ASP。而Windows &nbs

p;2000  Server版或Advanced  Server版,都已经自带IIS5.0。
    3 《中国分类主题词表》WEB数据库建库重点
  (1)《词表》WEB数据库除包含现有《词表》的全部内容,重点应以《中图法》第四版为基础,全面修订主题词及其与《中图法》四版类目的更新对应关系,对从三版到四版删改的分类号、类名、注释、对应的主题词及其参照关系进行修订,对新增类目和调整的类目编制对应主题词,对删改的叙词应建立参照关系或进行沿革注释。
  (2)《词表》WEB数据库要重点修订现有《词表》中类目与主题词的对应关系,提高《词表》的分类主题一体化标引功能和检索功能,使《词表》无论从类号还是从主题词检索都可查全相应的主题词和类号。如第一卷中"J915"下没有“音响模拟”一词,类似情况说明现有《词表》第一卷并未包括第二卷中的所有词汇,这就使得从分类入手进行主题标引时有些主题词未能得到选用。
  (3)随着网络化程度的迅速提高,检索语言的兼容问题已经成了必须解决的问题。为达到兼容目的,在规范语言中必须逐步加入自然语言,并建立词间关系,将对主题词的规范控制从要求检索者用规范词语转向由数据库内部依据词间关系进行转换控制。电子化《词表》应加大入口词的范围,大量增加非正式主题词,建立完整的词间关系,以满足各种类型读者的检索需要。
  (4)《词表》WEB数据库对于现有《词表》中由于各种原因而产生的错误和前后不一致的现象应认真检查修改。例如"J809(3)(5)"应为"J809(2)(3)(5)"、“平民教育G40.06”应为"G40-06"、“初级粒子Y次级宇宙线”,但在“主题词-分类表”中却找不到“次级宇宙线”一词。类似的问题给标引人员在标引时带来不便或无所适从。
  (5)《词表》WEB数据库中的标识符号应保持与现有《词表》相同。例如组配符合“:”、组配后置部分“,”、“△”表示用自然语言描述、“+”表示是《资料法》的类号等等。统一的标识方便了已经熟悉现有《词表》的使用者。但为了方便标引人员检索,可将现有《词表》中用作表示某个辅助表的“①”、“②”、“③”……改成"(1)"、"(2)"、"(3)"……这样方便使用者健入检索。
  (6)《词表》WEB数据库中所有的数字、符号和字母(无论大写还是小写)都应统一采用半角或全角输入,如类号、年代、数字及英文字母等。对于带引号的主题词,应采用统一的输入方式:或全部去掉引号或输入,或两种都输入,而在去掉引号的主题词下建立参见。对于个别计算机字库中没有的字,也应有一个统一的解决办法方可便于检索,笔者认为造字并非好办法。
  (7)电子化《词表》应解决现有《词表》中诸如"D3/7"之类的带有“/”类号的分解,将其中包含的D4、D5、D6……类号以及对应的主题词或主题词串标识出来,否则许多此种类号和主题词被隐含了,给标引带来极大的不便。
  (8)《词表》WEB数据库采用ASP语言进行数据库的查询检索开发。ASP是目前一种广为应用的用来快速构建动态WEB站点的编程语言,默认的内置开发语言是VBScript,由于ASP和微软Windows系列操作系统的结合非常好,使得ASP已经成为了NT/WIN2k开发平台上面进行WEB开发的首选语言和环境。他有着简单易学,方便快速开发的种种优点。
    4 《中国分类主题词表》WEB数据库的检索功能
  《中国分类主题词表》WEB数据库由《词表》机读数据(即分类—主题数据对应文档、主题—分类数据对应文档、索引文档)和检索系统(具有检索、显示、与书目接口等功能)两部分组成。
  (1)具有词表浏览、显示功能。标引人员可从任何一个入口词入手,浏览词表库中的有关类号、类名、注释、主题词(含词间的五种关系)、参照等各种信息。可多样化地分类显示,如类目等级树状显示、同级类显示、同位类显示、直接上下位类显示、参照显示等。
  (2)具有全文检索和超文本链接功能。对词表库中任一主题词、类号、类名、注释等内容均能进行等值检索、前方一致检索、逻辑组配检索或模糊检索,实现全文检索。可链接任一类号后出现的需要复分、仿分和专类复分的复分表、仿分表和专类复分表。
  (3)具有双标引功能。词表库的信息组织方法,使《词表》第一、二卷的数据形成了一个有机体,标引人员可从一个标引词入口检索,任意在分类号与主题词间转换标引时的主次关系,灵活取词,准确、快捷地完成分类—主题的双标引工作,实现信息处理工作的无纸化。
  (4)具有分类主题一体化检索功能。由于《词表》WEB数据库的检索功能包括了分类号检索、主题词检索、分类号和主题词组配检索等交互式检索方式,既适用于图书馆和其他信息处理部门分类主题标引、检索的需要,又满足了读者检索的需要,可成为局域网上的基础检索工具。
  (5)《词表》WEB数据库,采用人机对话方式,保证界面友好,尽量减少人工干预,分类主题标引准确、快捷、步骤少、简便易用、智能化程度高,尽量减少数据冗余度和内存占用,提高数据安全性,保证标引结果的规范化和标准化。
  (6)《词表》WEB数据库还应具有以下功能,一是带有检索、显示、与书目接口等功能的、独立运行的软件系统,可直接挂于网页(如校园信息网)供读者检索;二是可以和其他图书馆自动化系统挂接运行进行辅助标引或辅助检索的系统,特别是能成为国内几个应用较广的大型集成化系统中(如ILAS、博非特等)文献自动标引模块,以达到减少重复建库,节约时间,提高速度等目的。
  收稿日期:2003-04-08
【参考文献】
  1 文丽,方鹏,叶丁.试论分类主题一体化.佳木斯大学社会科学学报.2001,(3):137-138
  2 吴昌合.分类主题一体化:《中国分类主题词表》的特点,安徽大学学报(哲社版).2000,(6):117-119
  3 林彬,孟欣欣.计算机辅助分类主题标引系统设计——《中国分类主题词表》电子化.情报理论与实践,1999,(5):366-368
  4 梁开健,刘新民.基于asp的图书馆Web数据库开发.高校图书馆工作,2000(4):59-61
  5 詹萌.图书馆Web数据库的建立与asp技术的使用.现代图书情报技术,2000(5):50-52


【《中国分类主题词表》WEB数据库建设】相关文章:

基于PHP的Web数据库访问08-06

基于ASP的Web数据库访问08-06

ASP技术访问WEB数据库08-06

ASP技术访问WEB数据库08-06

ASP技术访问WEB数据库 208-06

ASP技术访问Web数据库的应用08-06

ASP开发Browse/Server模式的Web数据库08-06

基于Web的交互式数据库查询技术08-06

开发基于Web的地震目录数据库查询系统08-06