您现在的位置: 范文先生网 >> 理工论文 >> 计算机信息技术 >> 正文

中国地方志(旧方志)资源库的设计与展望

时间:2007-5-25栏目:计算机信息技术

元代治平江路,明代改为苏州府。清代沿袭明制,并将苏州府城定为江苏省治。依据地名规范原则,此条地名数据的规范地名选“苏州”,行政区划单位是“市”客观地名是“苏州、吴县、平江、平江”,但行政区划单位分别是“府、县、府、路”规范地名“苏州市”与客观地名“苏州府、吴县、平江府、平江路”之间具有相互参见关系,规范地名的异名为吴郡、吴州,它们与规范地名“苏州”之间是单纯参见关系,当用户以“吴郡”、或“吴州”做入口词,检索“苏州”时,机器会自动指引到规范地名“苏州”条目下,检索到它的相关信息。

(2) 人物资源库

凡出现在方志人物、选举、职官等篇目中的有较详细传记资料的人物(现暂定传记文字应不少于150个汉字),按照元数据标准进行规范处理,通过“单纯参见”或“相互参见”建立规范人名与非规范人名(又名)之间的联系。人物资源库基本内容包括:规范人名、又名(字、号、别名、笔名、室名等)、性别、籍贯(出生地)、民族、生卒年、主要活动年代、人物关键词、分类、相关信息等。一般人物以其“名”作规范名称,知名人物以人们熟悉的通行名称作规范名称。例如清代著名藏书家黄丕烈,字绍武,又字绍甫,号荛圃,别号荛夫、老荛、复翁等,室名学耕堂、百宋一廛、龟巢。在人物资源库中,此条数据的规范名称选黄丕烈,而其字、又字、号、别号、室名等则入“又名”字段,同时在规范名称(黄丕烈)与又名(字、又字、号、别号、室名等)之间建立单纯参照关系,用户可从黄丕烈的任一名或字、号入口检索,机器自动指引到规范名称———黄丕烈,检索出与他生平相关的信息。用户还可以通过相关人物字段检索到和黄丕烈同时代的苏州另外三个著名藏书家周锡瓒(字香岩)顾之逵(字抱冲)、袁廷(字寿阶)的相关情况。通过跨库链接检索到黄丕烈的著作(作品库)以及和他有关的地名、事件、插图、景点、研究文献等),用户也可以根据需要回全文影像库或OCR库查看原文。人物资源库多侧面、多角度地描述被传人物。

(3) 事件资源库

事件资源库收录了志书大事记篇或杂记中记载的重大事件。内容包括灾祥、战事等。依据元数据标准,对事件资源进行规范著录、标引。事件资源库基本内容包括:事件名称、发生时间、地点、事件简介、分类、关键词、相关信息(相关人物、事件、地名、作品、景点、志书、文献等)、影像原文、OCR原文和出处等。

例如清光绪二十四年(戊戌年,1898),以康有为为代表的资产阶级维新派发动了资产阶级政治改良运动,即著名的“戊戌变法”又称“百日维新”。此条数据的规范名称选用“戊戌变法”,事件又名为“百日维新”,规范名称与事件又名之间是参见关系,用户不论是从规范名称“戊戌变法”还是从事件又名“百日维新”都能检索到事件信息。用户还可以通过分类号、关键词等途径检索事件信息。通过相关信息(相关人物、地点、作品、景点等)跨库了解戊戌变法的代表人物康有为等的生平事迹、康有为的著述、事件发生地北京的情况,也可以返回全文影像库或OCR库查看在志书中的记载。

(4)作品资源库该库收录了方志艺文志、人物志中记载的著述、诗词、游记、散文、墓铭志等作品,依据元数据标准进行规范著录、标引。它与研究文献资源库的区别在于作品库的内容一定出自志书,所做的补充和扩展都是为了保证志书的作品的完整性而进行的。例如:《武功县志》上有关于骆宾王的记载,而艺文志中他的诗文作品收集的又不全,这时为了保证有关骆宾王诗文作品在作品库中的完整性,可以从志书其他方面进行补充和完善。

作品库内容包括:作品题名、作者、作品出处、出版情况(包括出版者、出版地、出版日期)、现存版本、发表时间或历史时期、关键词、分类、原文(图片资料、视频、音频资料)等、作品出处、提要和制作信息,并增加了相关地名、人物、事件、作品、景点、插图、研究文献、影像原文和OCR原文链接,使作品资源库内容更丰富、充实。以著名藏书家黄丕烈的著述为例,用户通过作品库不但可以检索到《苏州府志》著录的黄丕烈的著述:百宋一廛书录、百宋一廛赋注、士礼居诗抄二卷、还可以十分方便地检索到作品主人其他方面的信息,如研究文献《黄丕烈评传》。

(4) 插图资源库

插图资源库将志书中的舆地、器物、肖像、景观和营造等类插图,依据元数据标准进行规范著录、标引,建立插图资源库。该库内容包括:插图代码、名称、版框尺寸、出处、关键词、分类、相关链接(包括相关人物、地名、事件、景点、文化民俗、研究文献等)、图象信息(包括图像格式、图像文件大小、尺寸、分辨率和色彩深度等)。用户可通过插图名称、关键词、分类号等途径,检索到志书插图并能自动连接到同一志书的其他插图。还可以通过“原图”、“原文”按钮或输入URL网址与全文影像库、OCR库链接。

(6)景观资源库该库将方志中记载的名胜景观,依据元数据标准进行规范著录、标引,建立景观名称和它的又名之间的相互参见关系,并在该库中增加了景观图片、视频、音频资料,相关人物、事件、作品、地名和研究文献等信息,使景观内容更丰富、充实。该库内容包括:景点名称、位置、景观介绍(包括文字、图片、音频、视频)、分类、关键词、景观文化(包括相关人物、事件、作品、地名、研究文献等)、周边景观、下层景观并可以链接到影像原文或OCR原文。

(7)目次资源库该库记载国家图书馆志书收藏信息。依据元数据标准,对志书题名和志书中的卷次篇目进行规范处理。通过该库用户不但可以检索到志书书目,还可以对书中的卷次篇目进行检索。目次资源库的基本内容有:志书名称,目次名,版本项、载体形态、相关信息(地名、人物、事件)等。

(8)研究文献资源库收录后人对志书、志书版本、志书内容(相关人物、事件、地名等)的评论、研究、考证论文、论著。依元数据标准进行著录、标引。该库基本内容有:文献名称、作者信息(责任描述、工作单位)、原文、分类、关键词、文献发表时间、发表刊报、相关链接(包括相关事件、人物、作品、志书、地名、插图、文献)、影像原文、OCR原文等。

全文影像库,OCR数据库和八个专题子库相互关联,互为依托,构成数字方志资源库的主体。为了更好地说明方志资源库的内部结构,我们以陕西省《武功县志》为例,分析方志资源库中各个专题库之间的相互链接关系。

 假如我们从地名库进入,以“武功”做检索词,则在地名库这个条目下不但可以检索到武功县和与之相临的礼泉县的情况,还可以通过字段联接和词语置标标引等手段从地名库直接跨库进入相关子库检索到与“武功”有关联的人物(如李世民、苏武)、事件(如玄武门之变、苏武牧羊)、作品(如苏武李陵诗)、景观(如苏武墓)、插图(如李世民像)、研究文献(如苏武传)、目次(武功县志卷一)等,同时这些专题子库都可以与全文影像库和OCR库相链接,用户随时可以根据需要查看原文出处。同理,用户也可以从其他任意一个专题子库进入,检索效果相同,如图。

四.方志资源库的建库进程及展望  

我们在对馆藏情况(包括方志数量、质量、版本等)进行认真分析、调研后,就方志资源库的结构、规范、收录范围、工作进度、共建共享等问题反复论证、规划,在此基础上,我们推出了方志资源库演示版,并在2002年7月召开的《北京国际数字化公众信息服务与技术展览会》上进行了展览和演示,得到了与会各级领导和专家及观众的关注和肯定。现在我们已经开始了全文影像库的建设,到2002年底,我们计划完成330万页旧志的全文扫描,同时,对7月推出的演示系统进行完善,从明年开始着手制作与之配套的OCR数据库及地名、人物、事件、作品等八个规范化的专题子库。方志资源库完全建成后,应包括本馆所藏6000余种地方志(旧方志)及其相关信息资源。此外,我们还设想待今后条件许可继续扩大收录范围,一方面希望联合全国地方志(旧志)收藏单位,参与我们方志资源库的建设,另一方面将吸收我馆普通古籍中所藏的各种专业志资源,丰富其内容,将其建设成为更广大意义上的中国地方志(旧志)资源库。

通过上面叙述,可以看到正在建设的方志资源库是一个多维的信息资源网络,是一个非常宏大的工程。

国图特色鲜明的馆藏为开展数字方志资源库建设提供了资源保证,相当长时间内我们已经开展起来的二次文献开发和数据库建设为数字方志资源库建设积累了宝贵的经验,业已形成的图书馆自动化和服务网络为资源库建设提供了技术和手段保证,更重要的是我们有一支熟悉馆藏、熟悉古籍的专业人员队伍,依靠着这些优势,国家图书馆的数字方志资源库的建设一定会不断完善起来。

〔出处〕 国家图书馆学刊 2003(1)



上一页  [1] [2] 

下页更精彩:1 2 3 4 下一页