浅谈县级档案数据库基本组成部分和管理
[内容摘要]:档案数据库是档案信息资源建设的核心内容,也是档案信息系统的中心模块,档案数据库的建设就成为全国以及各地方的档案信息化建设过程中不可回避的问题。
[关键词]:县级档案数据库 档案数据库 数据库
2000年12月,国家档案局、中央档案馆印发的《全国档案事业发展“十五”计划》,把“加快档案信息化建设”、“加快现有档案的数字化进程”列入其中,同月国家档案局在档案管理化建设研讨会上宣布:“十五”期间,我国将加快数字化档案馆的建设。由此,传统档案馆数字化建设就引起了人们的关注。档案数据库是档案馆数字化建设的核心内容,也是档案信息系统的中心模块,全国以及各地方的档案馆数字化规划中都将档案数据库建设作为其重点内容。
一、档案数据库的概念
档案数据库是指在计算机存储设备上合理存放的、可以共享的、具有共同存取方式和一定组织方式的、相互关联的档案信息数据的集合。“相互关联”、“共同存取方式和一定组织方式”、“共享”是档案数据库本质的三个要素。数据库中储存的是一系列相互关联的档案信息数据,而不是杂乱无章的数据。这些数据包括档案题名、责任者、分类号、主题词、内容摘要等,还包括全文、图像、声音、影像等。这些相关联的数据是经过调查、试验、统计、整理和归纳后得到的,并经过合理分类和规范化处理之后,以记录的形式存储①。
二、县级档案数据库的基本组成部分
1、档案基础数据库
目前在我国也有一些地方档案馆开展数字档案馆建设,尝试建立档案基础数据库,但是多数档案馆还没有真正建立全面的、系统的、面向公众查档需求的档案基础数据库,而只是建立了一些专门的特定主题的档案数据库只能满足一些局部的特定的用户需求。
县级档案基础数据库的建设是一个长期的、复杂的系统化工程,它包括各类档案信息的组织与存储、档案资源的整合与集成、数据存储服务器和提供数据检索服务的软硬件平台的建设等。
当前,县级档案馆的发展水平也不相同,实际馆藏情况也不一样,档案基础数据库的建设应根据自身的特点、馆藏的实际情况,将馆藏档案进行普遍、全面的数字化处理,把档案馆的所有档案数据通过著录、扫描等形式,将档案信息由各种物理载体形式体现出来的信息,全部以数字记录方式存储到光盘、磁盘等计算机的各类存储器中,完成档案馆的馆藏档案信息向数字化转化的过程,这是数字化资源建设的重要基础工作,这也是建立县级档案基础数据库较为普遍可行的办法。
2、现行电子文件管理中心
社会信息化的发展,为现行电子文件管理中心的建立和运行提供了基本条件。现行电子文件管理中心的工作模式与以往的现行文件中心的管理方式有很大的区别,主要表现在对现行文件管理的统一和连续上。在完全依靠手工管理的时候,如果单位很分散,就很难实现对现行文件管理的统一和连续。而在网络化的环境中,文件传递和控制的技术壁垒可以克服,即使单位很分散,也可以方便地实现连续、统一的控制管理。
现行电子文件管理中心应负责现行文件和半现行文件全文数据的收集、整理、保管、利用、鉴定、销毁、移交等项工作 ,具体包括:一是现行电子文件的收集。现行电子文件管理中心的收集工作面对的是全社会,不仅包括党政机关、人民团体、事业单位等立档单位,还应包括不同所有制企业及个人所产生现行文件的全文数据。二是整理工作。现行电子文件管理中心应对接收的现行电子文件进行分类、整合、编目等整理工作,使其能够符合利用服务的要求。三是鉴定、销毁、移交、保管工作,现行电子文件管理中心收集的所有现行电子文件数据并不是所有的数据都能对外提供利用服务的,在提供利用服务前应对数据进行鉴定,通过鉴定能够对外提供服务的数据提供开放利用,不能提供的数据,应视其情况确定销毁或者向有关部门移交,可以提供利用服务的数据应妥善安排保管。
3、多媒体档案数据库
传统的档案数据库不包括多媒体数据,数据类型主要是通过扫描等方式形成的全文数据,随着图像、音频、视频等多媒体数据的不断增加,档案数据库也需要增加对这些数据的组织和管理,那么就应该建立专门的多媒体档案数据库。
目前各地档案馆还有大量有价值录音、录像、图片、照片及缩微胶片等档案没有转变成数据,档案部门应根据国家颂布的技术规范,采用扫描技术、光学字符识别技术、视频音频采集转换技术、微缩数字影像技术等多媒体采集技术,对馆藏的磁带、录像带、照片、胶片、图片等特殊载体的档案进行数字化处理,再以这些数字化处理后的多媒体数据为基础建立多媒体档案数据库。
建立多媒体数据库时,应在档案著录中对多媒体档案实体及数字化后形成的多媒体数据中的各种特征进行逐项著录,如载体类型、规格、多媒体文件格式等,使所著录的条目信息被有序的地存入多媒体数据库中,将相互关联的多媒体数据与档案实体以特定的方式组织起来,构建一个多媒体查阅平台,实现目录数据、与多媒体数据和档案实体的集成管理。
4、目录数据库
档案目录数据库是存储在计算机内相互关联的按一定次序排列的档案目录数据的集合,它提供存储和检索档案信息,是利用者利用档案信息的指南。
县级档案馆建立档案目录数据库,是档案资源信息化建设的基础,是数字档案馆建设必经之路,是实现档案管理现代化的重要途径。2008年国家档案局颁布的《市、县级国家综合档案馆测评细则》对档案馆提出了“建立馆藏全部档案及资料目录数据库;建立照片档案,音、视频档案全文数据库;建立珍贵重要及利用频繁纸质档案全文数据库”的要求。
各地县级档案馆在档案信息化建设的过程中,大多都建立了馆藏档案、资料目录数据库。通常采取的方法有以下二种:一是使用档案管理软件对馆藏档案目录进行著录,二是使用Microsoft Office Excel软件进行逐条录入。但是开展此项工作中应该重点把握以下两点:
(1)、严格按照国家标准《GB/T3792.5-85档案著录规则》②(以下简称《著录规则》)和《GB/T20163-2006中国档案机读目录格式》③(以下简称《机读目录格式》)的要求开展档案著录,严把数据标准关。1985 年颁布并于1999 年修订的《著录规则》主要是针对传统手工环境下的纸质档案著录设计的,没有全宗级别的著录项目,适用于案卷或文件级别著录,没能很好体现分级著录的思想,难以适应电子档案著录的新要求。为了弥补《著录规则》的缺陷,我国于2006 年颁布了《机读目录格式》。该标准规定了与国际和国家相关标准互相兼容的档案计算机机读目录格式,适用于档案目录数据库的建立和档案目录数据库的处理与交换。
(2)、如何确保档案目录数据与全文数据的挂接。《DA/T 31―2005纸质档案数字化技术规范》④已对目录数据与全文数据的挂接提出明确的要求。国内的主流档案管理软件基本上都具有此项功能,相关技术已趋于成熟,通常是以档案目录数据库为依据,逐个全宗逐个目录将每一份档案扫描所得的一个或多个图像存储为一份图像文件,通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,从而实现档案目录数据库与全文数据的挂接。
三、档案数据库的管理
档案数据库在档案信息化建设中的核心地位和重要作用,使档案数据库的管理问题成为一个不可回避的现实问题,为保证档案数据库的安全正常运行,应从以下三个方面做好档案数据库的管理:
1、档案数据库日常管理和维护
(1)、档案数据库的日常管理。首先应从操作系统维护管理做起,操作系统是档案数据库运行的平台,操作系统的日常管理就应与档案数据库的日常管理同步进行,比如查杀病毒、补丁安装、系统的升级等工作。其次档案数据库基本信息记录,主要包括记录档案数据库管理软件的系统日志记录、内存使用情况、存储空间情况、数据利用率等基本信息。
(2)、开展档案数据库健康检查。为及时发现档案数据库中存在的问题,在日常管理和维护中,数据管理员要对档案数据库开展健康检查,检查应从二个方面进行:一是硬件方面,通过硬件测试的方式确定内存使用、芯片运算、存储设备是否稳定运行等情况,确定各种硬件设备是否能够正常工作。二是软件方面,主要通过检查是否出现报错、文件丢失、数据丢失等情况确定档案数据库管理软件是否正常运行。
(3)、档案数据库的维护。为确保档案数据库的平稳运行还应经常进行数据库的维护,数据库的维护也可分为二个方面进行,一是硬件维护,通过日常基本信息记录和健康检查,查找出出现问题或能够正常工作但不稳定的硬件,进行维修或更换,还应及时对硬件进行升级等维护。二是软件维护,添加新的数据后应及时对档案数据库进行数据重组,确保档案数据库管理软件的合理运行。
2、档案数据库安全问题。
档案数据库的安全是档案馆数字化建设不可忽视的一个重要方面。有相当一部分档案数据是需要控制使用的,所以档案数据库建设中必须采取一系列措施保证档案数据的保密和安全。通常采取的措施可以分为制度管理和技术保证两类,档案数据库建设中对此应该形成一套管理制度体系,此外还需要有相应的技术措施进行自动控制,才能做到更加严密。在黑客猖獗和网络安全保护手段不健全的情况下,为了确保档案数据的保密和安全,对馆内不同用户根据权限提供档案数据,使档案数据首先在馆内达到资源共享,对馆外应根据不同的授权提供相应的数据服务。那些有机密性的、不开放的档案数据一定不能存放在有网络的服务器上。
3、档案数据库的备份。
在档案数据库的建设和管理中,数据的安全性是极为重要的。无论是来自自然灾害的威胁,还是人为主观因素的灾难,一旦所保存的数据被破坏或丢失,就会对整个档案数据库的价值造成严重的影响。据不完全统计,威胁档案数据库数据安全的因素有以下几个方面:一是自然因素:地震、火灾、雷电、洪水、飓风、工业事故等;二是人为因素:盗窃、蓄意破坏、病毒、缺乏经验造成的误操作、压力和恐慌造成的误删除等;三是硬件故障:硬盘损伤、服务器宕机、电源故障、存储器故障等;四是软件故障:数据库设计缺陷、应用软件故障、操作系统故障等;五是战争与冲突等:然而,任何以预防为目的的保护措施,无论其多么全面周到、细致入微,都只能尽量地减少而不是杜绝灾难的发生,当突发事件和人为、意外造成的数据的损坏、丢失的时候,最关键的问题就是如何恢复数据。因此,做好档案数据库备份成为档案数据库建设的重要问题。⑤
定期对档案数据库进行完全备份,现在比较常见的备份方式有二种。第一种是刻录光盘,固定一个时间段,使用光盘对整个数据库数据进行备份。这种备份方式的好处是:当发生问题时只需要用问题发生前最后的备份光盘,就可以恢复丢失的数据。不足之处,首先,由于是定期对整个数据库数据进行完全备份,在这个时间段里添加的新数据就没有备份,容易造成数据丢失。其次定期备份会造成备份的数据大量重复,这些重复的数据将产生大量的光盘,这就意味着增加成本。第二种是使用移动存储设备,随时添加新数据随时做备份。这种备份方式的好处是:可以随时进行数据备份。这种方式的不足之处,就是对移动存储设备的要求较高。
参考资料:①、百度百科《档案数据库的概念》
②、《GB/T3792.5-85档案著录规则》
③、《GB/T20163-2006中国档案机读目录格式》
④、《DA/T 31―2005纸质档案数字化技术规范》
⑤、百度百科《数据备份》