为了规范、科学、合理的开展纸质档案数字化工作,使档案信息资源准确、方面、快捷地提供利用,以满足学校对档案的需求,现参照《纸质档案数字化技术规范》(DA/T 31-2017),并结合本馆实际,制订本技术规范。
一、本规范的适用范围
本规范规定了纸质档案数字化技术和管理要求。
本规范适用于采用扫描设备对纸质档案的数字化加工过程及数字化成果的管理。
本规范适用于档案部门自行开展档案数字化工作。
本规范适用于档案数字化外包工作的管理,同时参照《档案数字化外包安全管理规范》(档办发[2014]7号)实施安全管理。
二、纸质档案数字化的基本原则:
1.规范性原则:所有档案信息必须按照规定的技术要求、文本格式和工作标准进行数字化,并尽可能采取通用标准,在特定技术参数方面适当调高,确保纸质档案数字化成果质量,最大程度地展现档案原貌。
2.安全性原则:在档案信息数字化过程中应加强纸质档案数字化各环节的安全管理,确保档案实体和档案信息的安全。加工涉密档案时,应按照涉密档案相关保密要求开展工作。
3.效益性原则:在充分调研的基础上选择最优的档案信息数字化方案,包括选择最优的工作流程、最合理的技术手段和最适宜的数字化加工设施等。
三、组织与管理
1.机构及人员:成立由分管领导负责的纸质档案数字化工作组织,配备相应能力的工作人员,明确档案数字化管理的部门、人员及其职责,确保数字化工作的顺利开展。
2.基础设施:应配备专用的数字化加工场地,并根据数字化加工过程进行合理布局。合理规划、配备和管理纸质档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。数字化加工场地应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染、视频监控等安全管理要求。
3.管理制度:纸质档案数字化管理制度应包含岗位管理、人员管理、场地管理、设备管理、数据管理、档案实体管理等方面的制度。
4.档案数字化外包:纸质档案数字化工作如需外包,档案部门应从企业性质、股东组成、安全保密、企业规模、注册资金情况等方面严格审查数字化加工企业的相关资质。如需审查数字化加工企业的保密资质,档案部门应按照《国家秘密载体印制资质管理办法》(国保发[2012]7号)等文件的要求执行。在项目实施过程中,应依据《档案数字化外包安全管理规范》(档办发[2014]7号),档案部门、数字化服务机构、数字化场所、数字化加工设备、档案实体、数字化成果移交接收与设备处理等层面执行严格的安全管理要求。
三、纸质档案数字化对象的确定:
应当对所要进行数字化的对象按照一定的原则和利用方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。
1.保护至上,分步实施原则
2.需求导向,利用优先原则
3.剔除无用,避免浪费原则
四、纸质档案数字化技术要求
1. 扫描档案的总体要求:每张图片应在200%的查看比例下,字迹、边框清晰,图片上加有水印专用章、图片顺序号与案卷的页码号一致;
2. 扫描均为24位色彩色模式。分辨率要求:历史档案:≥400dpi;非历史档案:≥200dpi。数码相机拍摄档案的分辨率要求:相机的像素设定应相当于或大于分辨率200dpi;分辨率的设定应以“每张图片应在200%的查看比例下,字迹清晰、完整”为原则;若有特殊情况导致影响扫描图像的利用和阅读的(包括图像的清晰度是否理想、图像大小是否合适),可根据实际情况作以调整:
3. 对于所扫描图片原始文件,按照相应的规格,在保存时,应按照图片的最高品质保存;对于压缩、处理后的图片,应保证图像的清晰、可读。
4. 图片宽度一般设置为430-600像素,每幅图片的宽度和长度最大分别不得超过1000像素;图片大小设置为90-150K,最大不得超过150K;图片尺寸和大小的设定原则应按照档案信息管理系统的要求来设定。
5. 图形图像的存储格式为:JPG、PDF;图像文件OCR转换后的存储格式为:DOC或XLS;PDF格式的文件内部顺序应与相应的案卷页码顺序保持一致。
6. 加工方应提供三套图像数据光盘。一套为初始图像;另一套为加入水印后的图像;还有一套为初始图像的PDF格式的文件。此外,光盘的品牌、型号、规格等指标参数必须经档案馆认定。
7. 各个门类的档案在加工处理上可能存有异同,相异之处,应按本门类档案的特有属性来加以区别对待,并按事先约定的特殊要求和程序来处理。
加工方在移交图像之前,应对图像偏斜度、清晰度、失真度、排列顺序以及是否漏扫等方面进行检查,不符合质量要求的,应重新进行图像的扫描或处理。
五、纸质档案数字化工作流程及具体要求
纸质档案数字化的基本流程主要包括:档案提卷出库、完善目录数据库、档案数字化前处理质检、档案扫描、图像处理、图像存储、图像质检、档案数字化成果挂接、数据验收移交、档案还原入库等环节。具体流程及主要技术要求按照以下几点执行,主要包括:
特别要求:加工过程必须建立严格的质量检测体系,要求加工流程每个环节都加入质量检验工作并指定专人负责,发现问题立即修改,并做好记录。
1、档案交接,提卷出库
(1)根据采购单位工作进度制定提卷还卷计划,分批次调取档案并填写《档案出入库交接表》,表内需列明所需调取档案的批次、全宗号、档号、卷数等。
(2)档案调出库房应由双方共同清点案卷数量,仔细查看每个案卷,对于案卷有否破损、残缺、漏页、缺页、有无卷内目录、页码是否连续、装订是否牢固等情况均记录备案,并作为档案再入库验收的依据。清点核实后由采购单位项目负责人和中标单位项目负责人共同在《档案出入库交接表》上签字,完成交接后立即将档案转移到数字化加工场地,档案严禁带离现场;
(3)档案领取后由中标单位项目管理员统一存放在加工现场的周转档案柜中管理,确保实体档案在数字化加工过程中的安全。数字化加工岗位逐卷领取档案开展工作,并同时填写《档案数字化加工流程单》,按要求记录各环节情况。中标单位项目管理员须监督各工作人员,各岗位工作台不得堆放档案,加工完毕或每天工作结束所有档案必须入柜上锁存放,必须检查工作台面和周边地面,特别是扫描岗位,必须对扫描仪进行检查,严防档案遗落、丢失。
2、档案拆卷
(1)拆卷前,先检查卷内文件是否编有页码。未编页码的,用铅笔编写在单面材料的右上角,编制双面书写的文字材料时正面编写在右上角、反面编写在左上角;
(2)如发现卷内目录和卷内实际分页不符,整理人员校核后用铅笔修改错误的页码;
(3)拆卷时,拆除装订物应注意保护档案实体不受损害,后续装订尽可能按原装订孔装订。对于必须裁页才能扫描的文件,在经采购单位项目负责人同意后方可用裁纸刀沿文件原有折痕细心裁切,不得徒手撕裁;拆卷后的所有案卷一律平放,不得竖放和侧放;
(4)如发现卷内文件有破损、残缺、缺页等特殊情况进行登记,数字化加工之前先进行档案修裱,同时在记录表上注明是否已修裱标记。
3、完善目录数据库
按照中央财经大学档案馆档案信息著录规则的要求,对照档案原件规范目录数据库中的档案目录字段信息,包括确定档案目录的著录项、字段长度和内容要求。检查著录字段是否正确、是否完整;如有错误、不规范或缺失的案卷题名、文件名、责任者、起止页号和页数等字段,应进行修改。未著录的卷内文件目录需按照案卷原件建立卷内目录索引,对录入信息进行校对检查。
档案数字化前对纸质档案目录进行修改、补充的结果录入数据库,形成准确、完整的目录数据。
4、档案数字化前处理质检
根据《档案数字化加工流程单》核对实体档案次序、编页页数、拆卷等情况,确保档案实体完整、页码有序、修裱质量符合要求,确认在扫描前的工序当中没有对实体档案造成人为的损坏。质检发现错误应如实登记并经项目管理员确认后,返回出错责任人修改,并对责任人进行处罚。
5、档案扫描
根据档案幅面的大小选择专业扫描仪,按档案原样扫描。一般普通纸张的案卷采用高速扫描仪进行批量快速扫描;针对纸张状况较差,以及过薄、过软或超厚的档案,采取加保护套及平板扫描方式。对于纸张太大无法高速扫描的,应采用平板扫描,注意科学合理的切分,并应在对应的文件题名中作以说明或标记,无法标记的,应登记说明;
扫描均为24位彩色模式。分辨率要求:扫描分辨率应不小于300dpi;如档案中文字清晰度较差、纸张状况较差、有照片、破损修裱时,扫描分辨率应不小于400dpi;如档案大图、手稿,扫描分辨率应400~600dpi。分辨率的设定应以“每张图像应在200%的查看比例下,字迹清晰、完整,图像上加有水印专用章、图像顺序号与案卷的页码号一致”为原则;若有特殊情况导致影响扫描图像的利用和阅读的(包括图像的清晰度是否理想、图像大小是否合适),可根据实际情况作以调整,使图像最大限度接近实体档案原貌,以保证图像的准确有效性。在保存时,应按照图像的最高品质保存;对于压缩、处理后的图像,应保证图像的清晰、可读。
(1)扫描工作开始前,应检查扫描软件技术参数设置是否正确;
(2)扫描时,必须保证文件夹命名正确,具体命名规则参见7、图像存储部分;
(3)扫描时,必须按照页面顺序进行逐卷、逐页扫描,先扫案卷封面和卷内目录,将封面和卷内目录各自单做一个文件扫描;同时对照卷内目录所示页码对卷内文件进行分件扫描;扫描时做到不缺页、不重页、图像内容完整,包括文件上的正文、页码等必须扫描齐全完整,并对上一环节前处理的质量进行检查,确保扫描图像与实体档案一一对应。如发现错误,对照《档案数字化加工流程单》对应信息,退回纠错。
(4)初始扫描时,应将档案纸张放置端正,扫描图像的倾斜度不得超过1度,不允许有折角、遮字或者缺损。扫描应尽量减少扫描图像的黑边和杂点。
(5)如连续出现扫描图像质量问题,中标单位项目负责人应立即查找原因,检查设备,及时维护解决问题,不得影响工作进度。
(6)扫描要务必避免漏扫、错扫、重扫、分件错误、图像残缺等现象;
(7)扫描后的纸张应保持页码排序正确,并对已扫描的案卷作以简单的整理。应保持扫描工作区域的整洁有序,避免案卷、文件混杂、无序、遗留;
(8)对大幅面档案采用大幅面专业扫描仪按档案原样进行扫描,不得采用分区扫描形成的多幅图像进行图像拼接方式,以保证档案数字化图像的整体性。
(9)扫描结束后需在《档案数字化加工流程单》中填写案卷的页数、及扫描页数。
6、图像处理
(1)对图像偏斜度、清晰度、失真度进行检查。发现不符合图像质量要求时,应重新进行图像的处理。
(2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
(3)发现漏扫或扫描不合格的图像要填写《档案数字化加工流程单》对应信息,报项目负责人确认后,安排责任人进行补扫或重扫后重新进行图像处理与质检。
(4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
(5)纠偏:对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
(6)去污:如需对数字图像进行去污处理,以去除在扫描过程中产生的污点、污线、黑边等影响图像质量的杂质,应遵循展现档案原貌的原则,处理过程中不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等痕迹。
7、图像存储
将数字化加工成果的数据文件存入移动硬盘,并按规范标准做好标签并提供清单。图形图像的存储格式为:TIFF、JPG、PDF、加水印JPG及PDF各一套。数字化加工成果包含双份四套图像数据:一套为TIFF格式原始图像;一套为JPG格式提供利用图像;一套为JPG图像组成的PDF格式的文件;及JPG、PDF加不可更改水印专用章各一套。以档案目录数据库为依据,将每一份档案文件扫描所得的一个或多个图像转换存储为一份PDF文件,印刷体档案要求制作成双层PDF文件,PDF格式的文件内部顺序应与相应的案卷页码顺序保持一致,其中多页文件要求PDF内每页大小相同。
存储时的压缩率选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为原则。
具体命名规则如下:
封面命名规则:档号+案卷题名+封面
目录命名规则:档号+案卷题名+卷内文件目录
文件夹命名规则:档号+案卷题名(卷内文件总页数)
文件(图像)命名规则:单页文件和多页文件均采用该文件与之对应的唯一档号+文件名+三位流水号的文件页码
文件(PDF)命名规则:文件对应的唯一档号+文件名
备考表命名规则:档号+案卷题名+卷内备考表
将扫描图像数据及整理PDF文件存储到相应文件夹时,要认真核查每一份文件的名称与档案目录数据库中该份文件的档号及题名是否相同,文件的页数与档案目录数据库中该份文件的页数是否一致,文件的总数与目录数据库中文件的总数是否相同等。
8、图像质检,备份数据
检查标准:检查扫描参数、扫描分辨率、存储格式等是否正确;检查图像数据的清晰度,以及可读度、失真度(确保放大200%图像依然清晰);检查文件夹及文件命名是否正确;检查每件档案页码的连续性;检查扫描图像文件数是否与实体文件总页数一致;对发现的图像质量有问题,参数设置不正确,图像缺失,数据库混乱等情况及时进行处理。
经检查合格的完整数据应及时进行备份。
(1)数据检验
备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。
(2)备份标签
数据备份后应在相应的备份介质上做好标签,以便查找和管理。
9、图像挂接:
挂接数字化数据成果。档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为"合格"后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索,实现批量、快速挂接。
通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,上传带水印的JPG图像及PDF文件,实现档案目录数据库与图像文件的批量挂接。并核对每一份文件挂接后页码、页数是否与扫描前一致,不一致时分析原因并记录,对挂接错位或明显不能利用的页面重新进行扫描。
10、数据验收移交
档案数字化项目成功的验收,必须经采购单位组织的项目验收小组审核签字后方有效。档案数字化成果验收内容包括四方面:档案原件还原质量;文件目录及字段核查著录质量;扫描图像质量;数据挂接质量。
验收标准:以抽检部门档案对应的数量(卷、件、页)为基数,各项抽检合格标准如下:
(1)档案原卷还原质量:保证档案还原整理规范,无前后颠倒、页码缺失等现象,保证实体档案还原质量达到100%。
(2)文件目录及字段核查著录质量:著录项著录完整、准确,档号合格率为100%,其他著录项错误率不得超过千分之五,确保文件目录及字段与档案实体一致,不影响图像挂接。
(3)扫描图像质量:漏扫率≤1‰,图像倾斜度≤0.5度。
(4)数据挂接质量:挂接正确率保证100%。
验收审核:在验收中检出的错误,中标单位有责任按照要求及时整改。经项目小组审核仍不合格的,该卷档案全部退回整改。返工2次检查结果仍不合格的,视同中标单位违约,采购单位不予支付该卷档案数字化款项。
中标单位必须将前一批次的交接档案连同制作完成的数据移交给档案馆,同时统计记录扫描卷数、件数、扫描图像张数及大小。中标单位应对前一批次计算机硬盘上留有的数字化档案信息应该予以清除。
11、档案还原入库
数字化加工后的档案应依照档案原样进行还原整理,同时使用采购单位提供的一次性清洁用具进行档案盒清洁,档案还原需注意以下要点:
(1)清点档案数量,检查案卷封面、目录、原件、备考表等构成部分是否齐全和一一对应;
(2)档案还原装订是否牢固,检查各档案是否有破损、丢失、遗漏、混乱等情况,如发现是属于前环节操作不当导致的,应及时报告项目负责人,则追究有关人员的责任;如是装订人员在工作中操作不当导致的,则应及时纠正,并及时报告,情节严重的,则追究有关人员的责任;
(3)正确排序:检查页码排序是否正确,检查文件正反面、横竖面是否正确;
(4)检查大幅面纸张折叠是否正确合理,检查是否有破损严重的,如有则应进行裱糊修裱;
同一批次出库的档案在完成数字化加工并经采购单位项目负责人验收合格后,中标单位项目管理员按照《档案出入库交接表》,检查应交还档案的数量是否与出库时一致,并对归还档案进行清点、检查档案的完整性,确认无误后向档案馆归还。采购单位项目负责人进行现场清点并抽查档案的完整性,确认无误后,由中标单位完成该批次档案入库上架工作后,采购单位项目负责人在《档案出入库交接表》上签字确认,完成档案入库交接手续,即可进行下一批次档案出库流程。