您现在的位置: 范文先生网 >> 理工论文 >> 计算机信息技术 >> 正文

西北地方文献主题标引中自由词的使用及质量保证

时间:2007-5-25栏目:计算机信息技术


西北地方文献是指文献内容涉及今西北地区的陕、甘、宁、青、新五省(区)地域知识的一切知识信息载体。它是对西北五省(区)自然现象、社会现象以及人的群体活动方式的记录。西北地区历史文化悠久,丝绸之路文化、敦煌文化、陕西的皇陵墓葬文化、宁夏的西夏文化以及西北各地均有分布的石窟文化等形成了独具特色的西北文化。西北地区丰厚的文化底蕴,使得流传下来的记录和反映这一地区历史的文化典籍十分丰富。

传统的手工编目时期,图书馆为读者提供检索西北地方文献的工具是由分类目录、书名目录、著者目录、地区分类目录组成的图书目录检索体系,为读者手工检索西北文献资料起到了引导作用,成为读者利用图书馆的主要检索手段。如今,图书馆手工编目工作已逐渐被计算机编目所替代,读者检索途径也随即由手工检索转向计算机检索,主题检索已成为最简便、最迅速、最全面的检索途径。目前,国内大多数图书馆在数据库建设中使用规范主题词标引,即:依据一定的规则经事先规范而形成词语,使用时标引人员必须按主题词表把主题因素转换为规范化的主题词。规范主题词标引在实际工作及应用中,已反映出了一些问题:标引工作负担重、速度慢;主题词表收词范围有限,缺少相应的概念词,使得文献主题概念转换成规范词时易造成检索词的专指度降低,从而影响查准率;结构的复杂性直接造成读者检索困难等。针对规范主题词标引工作中的不足,本馆在总结经验的基础上,根据西北地方文献的特殊性,决定在西北地方文献特色数据库建设中使用自由主题词标引(设定在610字段)。自由主题词是指未经加工、规范的,具有较大识别功能的词语,使用时标引人员可直接选用文献题名、文摘或正文中出现的语词。自由词具有标引简便、速度快、专指性强的特点;采用自由词标引符合客观需要,它可以不受限制地随需要增补文献中出现的任何一个具有实际检索意义的词语;自由词解除了规范词的种种限制,不需要复杂的检索规则,读者能够较快适应,易用性强。笔者结合参加西北地方文献标引工作的实践体会,对自由主题词的使用及质量保证谈一点粗浅的看法。

1 自由主题词的使用

1.1 补充了主题词表的不足。主题词的宽泛性及动态性特点,使得词表存在诸多缺陷:(1)在编制词表的过程中,由于受到许多主客观因素的影响,词表本身无力包含大千世界无以计数的事物现象。(2)随着社会的发展,新事物、新技术、新问题层出不穷,许多新概念、新名词术语相应出现,显示了新词蓬勃发展的强劲势头。而规范词使用的《中国分类主题词表》及《汉语主题词表》在当初编制之时,一般难以预料到这些新概念、新名词术语的出现,目前在主题词表的修改方面,显然也无法跟上社会发展的步伐。(3)词表编制时收词遗漏情况也很多。在实际工作中,使用规范词标引若出现上述所说的任何一种情况,就只有通过直接上位词或靠词标引来表达,但标引质量与检索效果比起用专指词来表达,其结果是显而易见的。而采用自由词标引可以较好地解决此类问题。举例来说,《甘肃两西扶贫开发战略与对策》一书,使用规范词标引,就会因词表未收有概念专指词“两西”、“扶贫”,只有转换为代用主题词标引为“社会救济—甘肃”、“农村建设—甘肃”;而使用自由词可直接标引为“两西建设—甘肃”、“两西扶贫—甘肃”等。自由词的使用能够更直接、准确地表述规范词所无法涵盖的内容。

1.2 满足了地方文献特色的需要。地方文献是一种宝贵的地情信息资源,具有特殊的地方文化特性。由于地方文献的特殊性及收藏内容的专指特点,仅使用规范词无法全面、专指揭示地方文献信息资源。而自由词采用从文献中直接抽词标引的方式不易发生误标引,标引准确性高,更适宜于地方特色文献。以我馆为例,收藏的西北地方文献主要包括敦煌学及其研究资料、汉简及其考释研究、中西交通史(包括“丝绸之路”研究)资料、西北民族宗教研究资料、西北地方历史地理研究资料、西北地区文物的研究考释资料以及西北各省、市、县地方志等等方面的资料。这些具有鲜明地方文化特色的文献,若按词表取规范词进行标引是难以满足其需要的,只有采取可随需要增补检索用词的自由词标引方法才能弥补这一不足。例如, 《敦煌本〈佛说十王经〉校录研究》一书进行主题标引时,使用自由词可标引为“敦煌遗书”、“佛说十王经”,而使用规范词只能标引为“敦煌学”;《清实录青海民族史料辑录》一书,取规范词只能标引为“少数民族史—青海”,而自由词还可直接标引为“清实录”等。就标引深度及读者检索而言,显然自由词具有灵活、专指性强的特点,较规范词更胜一筹。

1.3 方便了读者检索。主题标引的最终目的是方便读者从主题角度去查阅文献。但是,读者不是检索语言专家,不可能花费时间、精力去学习查找规范化的主题词表以获取规范化的词语,况且,严格规范后的主题词若缺乏对它的足够认识也无法检出满意的文献。而自由词具有读者熟悉、使用频率较高的特点。采用自由主题词检索也无繁琐规则的约束,词量又大,检索标识可从文献题名、地名或正文中抽取,检索用词符合读者日常的表达习惯,读者可以自由选择能准确反映自己意图的词语作为检索词来检索所需文献。举例来说,中国新疆境内的罗布泊地处古代沟通东西文化的通道———丝绸之路的要冲,在我国古代史上享有盛名,然而,由于自然条件的变迁和社会、经济等原因,致使此地成为人迹罕至的一片荒漠,变成一个充满自然之谜的神秘地区。近年来,尤其是党中央西部大开发战略的实施,使“罗布泊”、“楼兰文化”的研究再度引起世人的关注,与此相应的文献史料及研究文集不断涌现,诸如《神秘的罗布泊》、《罗布泊科学考察与研究》、《楼兰文化研究文集》等有关文献资料。而西北地区文献标引中自由词标引的运用,使读者在检索此类书时可直接选用专指词语“罗布泊”、“楼兰文化”即可获得这方面的所有资料。可以说,自由词的使用,使检索专指度更强。正是由于自由词符合读者的检索思路,所以在很大程度上方便了读者检索,给读者检索提供了一定的自由空间。

2 质量保证

使用自由词标引西北地方文献极大地方便了读者检索。而自由词标引质量的高低将直接影响文献的检索率和利用率。标引质量的高低也是自由词能否顺利利用的关键因素。而要保证标引质量,应注意以下几个方面:

2.1 标引人员素质。标引人员的知识水平及标引技术直接影响标引质量。因此,从事地方文献标引工作的人员不但应该具有较强的专业知识,还应该具备一定的文献学、历史学方面的知识,具备掌握计算机操作技术及编目软件系统的能力。知识面要广博,要熟悉西北地区天、地、人、事、物的基本情况。同时还要具备严谨细致的工作作风及良好的质量意识。

2.2 主题分析。主题分析就是分析文献所反映的主要内容。标引人员在做自由词标引时一定要详细审查文献的书名页,阅读内容提要,浏览目次、序言、出版者的话、前言、后记和绪论,浏览全书内容。对比较复杂、分析起来有一定难度的问题要查阅文献引用的参考文献,参考各种工具书或与有关专业人员讨论研究,以形成正确的主题概念。如果文献内容中含有在提名中未反映出来的有价值的信息,可单独作为主题进行标引。这实质上是对文献所含的有独特价值的潜在知识、信息和情报的标引。标引主题可以是一个,也可以是一个以上,只要能确认其对读者、研究人员有参考价值,就可作为一个主题进行标引。举例来说,西北民族学院有位博士生写毕业论文时,用了近半年的时间在本馆西北地方文献部查阅有关“茶马互市”的资料。但是,迄今为止,还没有一本题名有“茶马互市”的研究资料或书籍。“茶马互市”分散在诸如《清代西北民族贸易史》、《陕西商帮史》、《中国丝绸之路交通史》、《丝绸之路贸易史》等书籍中,题名无法直接反映出来,给这位读者查阅造成了很大的困难。对标引人员来说,这就是一个典型的文献内容中含有而在题名中却未反映出来的有价值的主题信息。用自由词标引就可直接使用专指词“茶马互市”。将来若有读者需要此类文献,只需通过主题检索便垂手可得“茶马互市”的全部资料。由此可见,题名中未反映出来的有价值的文献信息,对读者非常重要。因此,标引人员在进行主题分析时,一定要认真细致,反复琢磨,不可遗漏有史料价值的任何文献信息。

2.3 选词。标引人员对文献内容分析找出文献主题后,凭自己的术语知识和对标引规则的理解,自主地用确切的词语来直接表达所分析的主题概念。用词一定要做到简洁、明了、准确,以符合读者的检索思路。具体讲,选词须注意:(1)使用专指词。主题词专指度越强,检准率越高,因此在标引中应优先考虑、使用与文献主题概念直接对应的专指词。比如,前面所提到的“两西建设”、“茶马互市”、“罗布泊”等专指词。(2)词的简称形式必须换成全称形式。例如《兰大校庆纪念文集》应当用“兰州大学”。(3)宗教文献的标引尽量少用“戴帽”性质的词。例如,主题是“佛经”,就不要加“佛教”。再如“大藏经”、“古兰经”等。(4)避免使用没有检索意义的词语。比如,“分析”、“应用”、“方法”等。总的说来,自由词的使用并不是滥用或随心所欲任意使用。各馆可根据具体情况制定相关的标准,以提高自由词的质量。我馆专门制定了《西北地方文献主题标引规则》,其中对自由词的使用做了一定的规定及要求。

总之,西北地方文献数据库建设中自由主题词的使用是事物发展的必然结果。相信在不断地总结经验及教训的基础上,将会更加完善,也将在更大程度上满足广大读者通过主题检索西北地方文献的需求。

〔出处〕 图书馆理论与实践

[1] [2] 下一页

下页更精彩:1 2 3 4 下一页