您现在的位置: 范文先生网 >> 理工论文 >> 计算机信息技术 >> 正文

地方报纸信息数据库建设存在的问题及发展设想

时间:2007-5-25栏目:计算机信息技术


在我国报纸信息数据库建设中,地方报纸信息数据库发展较快。例如广东省的《南方日报》、《广州日报》、《东莞日报》等不但建立了报纸信息数据库,而且还继《人民日报》之后进入了因特网,向全球推出了电子版,使国外的华人同胞能够及时地了解广东在改革开放中的新风貌、新变化。

但是,由于政策与机制、技术手段与设备、社会信息意识、人员素质等多方面的原因,我国地方报纸信息数据库的建设尚存在许多问题。本文通过对上述地方报纸信息数据库的现状与存在问题的分析研究,提出一些设想和改进措施,以期对今后地方报纸信息数据库、电视台、电台新闻数据库以及其他数据库的建库工作实践提供一点参考和借鉴。

1 地方报纸信息数据库建设存在的问题

1.1 宏观调控不力,数据库建设重复现象严重

由于国家、地区间的宏观调控不力,主观上缺乏统一规划的思想意识,技术上缺乏网络环境的支持,属于事业单位的各报社缺少需求分析和用户界定,也很少注重数据库的利用率问题,致使各地方报社自行投资建库,造成数据库规模小,缺乏竞争机制,建库方式单一,在选题上重复与空缺并存,造成人力、物力、财力的极大浪费。例如《南方日报》、《广州日报》和《羊城晚报》,各自都建有报纸信息数据库。由于同属于广东地区的地方报纸,相当一部分内容是重复的。像“中国新闻”、“国际新闻”、“广州新闻”、“体育新闻”、“天气预报”、“金融证券信息”等报道,因为消息来源是一致的,所以几乎每天的内容都大同小异。

目前,从总体上看,地方报纸信息数据库开发重复现象严重;而从个别来看,由于地方报纸信息的地方性、复杂性与时效性和技术支持不够,以及人员专业素质较低等因素的影响,普遍存在现有的报纸信息资源开发不足的问题。

1.2 检索效果未如人意

一个实用可行的报纸信息检索系统应是外部特征检索、主题检索、分类检索、全文检索的综合应用[1]。目前已经建立的地方报纸信息数据库大多都只有外部特征检索和全文检索两种检索途径(见表l)。

表1 广东部分地区报纸信息数据库可检字段一览

单 位
外 部 特 征 字 段
内容特征字段

广州日报
(起始)时间、时间版次、作者、标题
关键词

南方日报
(1993-1996)日期、作者、标题、栏目刊头、头版头条、版名、版次、体裁、版序、类目

(1997-)日期、标题、版次、版名
类目名称

关键词

羊城晚报
(1991-1993)(起始)时间、时间版次、作者、标题

(1994-)标题、作者、时间、专栏、版次、注释(专题报导名称等)
专栏名称

关键词

深圳特区报
标题、作者、时间、版次、地区、来源
关键词

一般的用户都能快速简便地从作者、标题、日期、版次等外部特征入手查找资料,但前提是用户已事先知道要查找的资料所在的日期及其他信息,否则,用户要想扩大或缩小检索范围,查全查准资料,并非易事。数据库缺乏科学的辅助检索工具,影响了它的使用效果。

全文检索与其他检索途径相比,虽然具有不需人工标引加工、便于查找文章细节、检索结果直接可靠、检索详尽彻底、使用简便易学等优点,但在不进行任何控制的情况下,文章中的每一个字、词均可成为检索点,虽在输入方面大大节省了人力和存贮空间,却加重了检索方面的负担,使每次检索命令中的文献量偏多,筛选量过大,用户检索所需时间长,直接影响了查准率,造成了检索噪音。再加上“假义词”、同义词大量存在,更容易造成漏检错检,难以保证查全率和查准率。

1.3 人员素质及其知识结构影响数据库发展进程

由于多方面原因,我国新闻资料从业人员整体素质不太高,知识结构不合理。据调查统计,具有高级职称的新闻从业人员仅占全部人数的5%[2],信息学情报学专业毕业的工作人员更是凤毛麟角。近年来,一些沿海经济发达地区、尤其是广东地区的新闻资料从业人员的大专以上学历的比重有所增加,但大部分属于后继学历,而且学科专业不对口,从整体而言,同样存在素质不高、知识结构不合理的问题;负责开发数据库的计算机技术人员一般都不甚了解数据库所属专业,而数据库所属专业人员反过来也不懂计算机技术;负责开发报纸信息数据库的计算机技术人员,一般都不熟悉报纸信息的分类、主题标引等业务工作,同样,从事报纸信息业务的工作人员通常都不懂得计算机程序编写及系统设计等知识,或是只懂得一些计算机的基本操作。因此,常常囿于双方的沟通和知识结构差异的问题,都会不可避免地、或多或少地影响数据库的发展进程。

1.4 商品化程度尚低,不能向社会开放

目前我国已建的地方报纸信息数据库大多只供本单位内部使用,一般不能向社会开放,能提供商业化服务的更是屈指可数。其原因是:

(1)地方报社的行政体制束缚了信息服务的社会化与商品化进程。

(2)信息市场发育水平低,信息的价值与价格关系没有理顺,地方报纸信息服务的社会化与商品化缺乏大环境。

(3)社会信息化意识不强。一方面建库者对数据信息的社会性认识不足,只想独霸,不愿共享;另一方面是社会公众缺乏利用现代化手段获取信息的意识,习惯于从行政渠道下达的政策文件中获取信息,形成了信息需求上的惰性,即使是横向联系也要通过上级管理机构进行协调;加上对地方报纸信息数据库了解不多,或是由于网络通信等问题而放弃使用数据库。

(4)缺乏必要的资金投入与人力投入。数据库是属于技术知识密集、资金密集和劳动密集型的事业,没有足够的资金、人力及技术力量的投入,难以快速启动建成并维持长期正常运转和提供服务。目前多数地方报社资金仍然比较困难,人手短缺,信息数据库的工作人员大部分都是身兼数职,常常忙于内部服务,很难再向社会开放或开展商业化服务。

1.5 未能突出地方特色

大部分的地方报纸信息数据库,都只是把报纸上所刊载的内容收录入库,而没有进行深层次开发,没有把地方报纸信息数据库的地方特色发掘出来。目前我国地区经济发展水平不一致,尤其是有一些特定的地区、一些经济发展互动地区,这些不同的地区具有不同的地域文化(包括民俗和历史)、不同的人才群落、不同的文化研究机构、不同的信息资源、不同特色的地方产品等等。所有这些都会在地方报纸上有所反映,如果在建设地方报纸信息数据库时,能把这些地方特色发掘出来,就能更好地为新闻工作者乃至全社会提供服务。

2 地方报纸信息数据库发展的设想

在因特网席卷全球、我国“十大‘金’字号国民经济信息化工程”建设实施的形势下,笔者针对目前我国地方报纸信息数据库建设的现状及存在问题,提出如下的发展对策与设想:

2.1 采取地区联合建库方式

联合或合作建库应是信息网络时代的首选和长期的建库方式[3] 。地方报纸信息数据库更应如此。

由于地方报纸的地方性与部分新闻来源的一致性,同一地方的地方报纸的许多内容都大致相同。如果随着地方报纸信息数据库服务的社会化,社会各界对地方报纸信息的需求也会越来越大,人们期望在一个数据库中就能查阅本地区其他报社的报纸信息。在这方面“教育文献数据库”就是一个联合建库的例子。“教育文献数据库”是在广东省高等教育厅教学处领导下,成立建库领导小组,联合中山大学图书馆、佛山科技学院图书馆、广州师范学院图书馆等11所高校及师范院校图书馆共同参与建设,分散建库,数据共享。该库是“广东省高校图书馆网络系统工程”的一个重要组成部分,收录全国重点教育刊物上发表的文献,重点收录广东和港澳台出版的教育刊物(包括有关教育方面的地方报刊和年鉴),为各级行政部门、教育科研机构和各级各类学校的教育教学与科学研究提供教育信息。该库的建库领导小组定期召开成员馆主管馆长及建库工作人员工作会议,协调建库工作;举办培训班,培训各成员馆负责标引和录入人员,以保证数据库的质量。从1995年底开始建库至今,共录入数据15000余条,数据形式包括索引、文摘和部分全文,定期出版书本式索引文摘,提供教育信息。它不但得到了国家教委和广东省高教厅的大力支持和充分肯定,而且还受到了国内外专家同行

[1] [2] 下一页

下页更精彩:1 2 3 4 下一页