当前位置:首页 > 档案文化 > 编研成果

学会论文《档案数字化建设中的几点体会》

信息来源: 发布时间:2014-08-19作者:

麻城市档案局  邓晓珍
[内容提要]前期准备、数字化处理的做法、档案数字化的组织保障
[关键词]档案 数字化建设 体会
 
计算机软硬件及网络技术正以人们无法预料的惊人速度在发展,不知不觉中人们已被这种技术所左右。计算机正逐渐地浸入到我们的工作、家庭以及社会的各个方面。不能不承认这种技术的出现使人类的生活方式发生了改变,人们已越来越习惯于在网络上查找自己所需的信息资料。也许在未来的日子里当一个人想要查阅一份档案的时候,他首先想到的是在网上查阅,而不是到档案馆查阅。就要求我们必须提前将档案做好数字化处理,以方便更多的利用者。档案数字化是用计算机技术将模拟信号转化为数字信号的处理过程,在所有档案中,纸质档案构成了今天所保存档案中的绝大部分。因此,对纸质档案的数字化处理成为档案数字化的重中之重。现在我就我们平时在做数字化处理过程中的几点体会做一下总结。
一、前期准备
1、目录数据库建设。根据《湖北省机关档案工作业务建设规范》的要求,将馆藏的纸质档案的目录准确、完整地录入各级各类电子目录,并导入档案管理软件。
    2、制度建设。在全面开展纸质档案数字化工作之初,就应制定相关的工作制度、技术标准,明确各部门间的分工。并随着数字化工作的深入不断修订和完善相关制度,细化技术层面的标准。用制度、规则和标准管人,保证了数字化工作数量及质量。
    3、人员管理。高素质的工作人员是做好纸质档案数字化工作的基础,我们在进行数字化处理之前,必须注重提高现有工作人员的能力与素质,包括专业知识、技术知识、管理能力等的提高。为此,工作人员需接受系统的专业培训,让他们了解档案的形成过程及规范整理的方法,目的是使原来没有接触过档案的人员成为既懂档案管理又能熟练掌握现代信息技术的复合型人才。
4、建立网络。开展档案数字化处理的根本目的是最终的提供利用。所以我们必须建设能满足目录数据管理、全文数据管理、多媒体数据管理等各方面需要且相对独立的网络,这个网络应与互联网物理隔断,在选用硬件设备、软件系统和建立网络架构时,应考虑为今后设备扩充、系统升级和网络扩建留有一定余地。即配置能满足数字档案海量存储、查询、管理要求的服务器、终端机等;配备运行稳定、安全可靠、与硬件选型相匹配的主流操作系统;选用相应的扫描软件,以及Photoshop等图像处理软件;开发选购具备对档案目录数据、全文数据、多媒体数据的采集、加工、管理和利用等功能的档案管理系统。 
(1)计算机。计算机是档案数字化的工作平台。随着计算机技术的发展,在机型选择上没有太多的要求,最近几年出产的机型已经完全能够应对数字化处理工作。当然为了有较快的运算速度和较大存储空间,配置上是越高越好,如双核以上的处理器,2G以上的内存,500G以上的硬盘。
(2)扫描仪。扫描仪是在数字化工作中,对纸质档案进行数字化的工具。按可扫描的幅面大小,分A3,A4等扫描仪,可根据档案纸张的不同选用不同型号的扫描仪器。
(3)图像处理软件。主要用于管理扫描过程,以及对扫描后不规范的图像进行纠偏、去黑斑等处理。一般采用Photoshop图像处理软件。
(4)档案管理软件,选用能满足本地区馆藏(库存)的专用档案管理软件,档案馆一般采用网络版,机关档案室一般采用单机版。
二、数字化处理的做法
(一)纸质档案数字化处理的基本原则。纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。纸质档案的数字化,必须符合国家档案开放的有关规定。属于归档范围且应永久或长期保存的档案都应列入数字化加工的范围。
(二)纸质档案数字化处理的基本要求。应加强纸质档案数字化处理中各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。纸质档案数字化处理的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
(三)纸质档案数字化处理的基本环节。主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份等。其中档案整理和目录建库属于数字化处理的前期准备工作,我们通常所讲的数字化处理主要是指档案扫描、图像处理、数据挂接、数据备份等。
1、档案扫描
在正式开展扫描前,做好档案扫描前处理工作,合理确定需要扫描的范围,区分扫描件和非扫描件,避免重复扫描,提高工作效率。对利用率高的档案优先扫描;对暂时利用不多、没有解密或密级太高的档案,保存价值较高但不适合扫描的档案则暂缓扫描。有计划、有次序地安排文件扫描。如利用率较高的市委、政府、民政、林业、国土等部门和涉及民生的退伍军人档案、婚姻档案、干部个人档案、人口普查档案、知青档案等均应被列入了优先扫描的范围。
(1)扫描参数的选择
(1.1)分辨率。原则上以字迹和纸张质量来确定分辨率的参数,不能因为讲求速度而完全执行统一的技术条件和标准。一般文件分辨率为200dpi,而对于较为特殊、字迹模糊不清的档案文件要采用较大的分辨率。档案文件的字迹材料和字体各不相同,对扫描参数的选择就有很大的差异性,但原则上我们只要把握住图像清晰可读,能满足浏览查阅需要和用户提出图像输出的需求即可。
(1.2)亮度。亮度的设定比率一般在5与95之间。如果纸张的颜色深,高光点应适当提高,最高不超过95点;如果纸张颜色浅,字迹颜色浅、模糊,高光点应适当降低,但最低不低于60点。
(1.3)色彩模式。色彩模式分为黑白二值、灰度、彩色三种模式,一般我们对文字文件选用灰度色彩,对于字迹模糊不清、原纸张为彩色或有特殊要求的档案文件则采用彩色色彩扫描。
(1.4)文件存储。目前我们所扫描的档案文件存储方式主要采用图像格式存储,常用的格式有TIFF或JPEG。前者图像不损失,但占用磁盘空间大;后者可压缩的,占用磁盘空间小,但在数据转移中会出现不同程度的损失。因此,在扫描中要坚持正确的工作方法和标准,及时对数据进行质检,确保扫描文件的质量和效益。
(1.5)扫描文件的存储方法。在电脑中建立多个文件夹并分别进行命名,将扫描好的文件分别存储,并在每个文件夹中按年度建立子文件夹。对于文书档案中按归档文件整理规则整理的档案则应按年度―类别―保管期限―件号的不同分别建立相应的文件夹以方便管理和利用;其他门类的档案则按类别―案卷号―件号来建立文件夹。
2、图像处理与存储
图像的处理:我们在扫描中由于各种原因不可避免的会出现不符合要求的图像,这就要求我们对不符合要求的图像进行纠错处理。如图像偏斜度、清晰度、失真度不符合图像质量要求时,应重新进行图像的处理;由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描;发现文件漏扫时,应及时补扫并正确插入图像;发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整;对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准;对方向不正确的图像应进行旋转还原,以符合阅读习惯;对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理,处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则;对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
图像文件的命名:纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,应以该档号为这份文件扫描后的图像文件命名,多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。
3、数据挂接
数据挂接就是将档案进行数字化处理完成后形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过借助相应软件及时导入并关联(挂接)到数据服务器端,实现目录数据与数字图像的关联搜索,最终实现提供利用。
数据关联(挂接)是指以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的挂接提供条件。
4、数据验收
一般以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。我局的要求是一个全宗的档案,数据验收时抽检的比率不得低于5%。目录数据库与图像文件挂接错误或目录数据库、图像文件出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”,必须重新进行目录数据与图像文件的挂接。一个全宗内的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,予以验收通过。
5、数据备份
经验收合格的完整数据应及时进行备份。为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。备份数据也应进行检验。备份数据检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。数据备份后应相应的备份介质上做好标签,以便查找和管理。
三、档案数字化的组织保障
 (一)领导重视,不断加大资金和人员投入力度。领导的重视与支持有力推动了档案数字化工作的开展,稳定的资金投入在人力、资金和设施设备等方面给予充分保障,只有这样才能保障“档案数字化”建设的顺利实施。
 (二) 利用优先,分步实施,确定数字化处理的原则和工作模式。有计划、分步骤地把馆藏各种载体的档案全部实现数字化,并且在实施过程中保持档案的完整性。要对每一全宗每一案卷的档案都进行数字化,而不是对全宗内、案卷内的文件有所选择地进行数字化,要遵循“利用优先,分步实施”的原则,摸索出一套适合本地区工作实际的档案数字化处理的工作模式。
 (三) 规范管理,快速推进档案数字化规范体系建设。几年来,我局(馆)在实践中不断总结经验,在经验中提炼精华,再把精华归纳为制度和标准,形成符合我市实际的制度标准化体系,指导档案数字化的具体工作,这是一个良性循环的工作模式,有利于不断提升档案数字化工作的总体水平。统一全市的档案目录数据库建库标准,为今后的数据共享提供方便。
 
参考文献:《浙江档案》2011年第8期,
《中国档案》2013年总第2528期第二版,
《重订档案信息网》档案室的数字化处理流程探讨