(一)古籍文献数字化加工建设
1.扫描设备:
(1)扫描设备:扫描设备选择零边距或非接触式扫描仪。设备A3幅面的光学分辨率不低于600dpi,CCD感光元件不低于5000像素点,色彩位数输入48位输出24bit,扫描设备使用无紫外线的同步冷光源,避免纸张褶皱、撕裂、破损等情况的发生。扫描图像无缺页、多页、压页现象。
(2)数码拍照设备:数码拍照相机的有效像素不低于5000万像素。
2.数据图像扫描:
符合国家标准《纸质档案数字化技术规范》。确保在扫描过程中不对文献原件造成二次损伤。保证文献扫描图像与原件一致、整洁、清晰。
(1)图像文件(各种格式)放大到1: 1状态,逐叶检查。检查文件是否有透光、透字、有彩点、彩线、太淡、太浓、黑边、污点、歪斜、模糊(马赛克等)或图像内容不完整等现象,不符合图像质量要求应进行图像校正或重新扫描。
(2)发现文件漏扫时,应及时补扫并正确插入图像。
(3)检查是否符合扫描规格要求和技术参数。
(4)所有文件保存位置正确,可以有效打开和显示。
(5)检查图像叶码是否连续,不得跳叶。
(6)文献以册/件为单位检查标引(描述和管理)数据是否完整、准确。
(7)按照命名规则,检查目录、文件、数据库、文档、介质等名称是否正确。
(8)检查各类说明、统计、验收等文档是否齐全。
3.元数据著录标准
(1)依据CNmarc规范,元数据内容包含:名录号、普查号、加工记录号、书目信息、索书号、提名项(提名卷数、存卷、其他提名)、责任者、版本项(版本类型、版本、版本地点、出版者、出版时间、牌记)、载体形态、分类、丛编项、批跋、馆藏单位、制作单位等要素。要求元数据信息与扫描数据信息正确对应,无错乱现象。针对全部文献进行编号和编目数据形成excel文件后,以利于今后进一步深度加工与利用,要求抽检错误率不高于千分之三。
4.数据文件保存级别:
数字化文件保存级别:档案典藏级,用字母A表示,是古籍数字化图像的主文件。用于数字图像的长期保存,可作格式转换和复制的母本。复制加工级,用字母P表示,通过主文件转换产生的衍生文件,用于加工复制各种精度、大小的屏幕浏览图像的母本文件。供专家、合作伙伴及专门组织成员网上有条件权限的访问。有较高的精度和较大的尺寸。发布服务级,用字母D表,由复制加工级转换生成。因资源用途和使用对象、使用场景不同应遵从规定的技术要求操作处理。
5.数据图像采集:
扫描数据采用600DPI标准PNG格式。要求对文献资源进行不拆装扫描,遵循尽可能保持文献原貌的原则。扫描图像要求完整、整洁、无歪斜、无黑边、浏览及打印清晰。根据文献情况,采用最为可靠的扫描设备和扫描方式完成文献扫描,避免纸张褶皱、撕裂、破损等情况的发生。扫描图像无缺页、多页、压页现象。
(1)古籍扫描避免透光,要求扫描图像清晰,不透字,能清楚显示文献水渍、霉斑等污迹。
(2)扫描必须按文献装订的实际顺序进行,不允许重叶、缺叶,错叶、折叶等情况发生(原书缺叶、错叶除外)。补扫缺叶图像要与同册图像文件的大小一致,颜色接近。按1:1比例扫描,叶面外围要求留白,宽度不超过1-2厘米;书叶间距不超过0.1厘米。
(3)以原书的上边沿为基准,以中缝为中心线,保持原文献的天头、地脚的尺寸不变,左右两边的尺寸基本不变。
(4)原件表面有其他粘贴物件时,先将原件与粘贴物(即粘贴物覆盖于文献)一起扫描,然后将粘贴物掀开(不允许拆装),再次扫描原件。
(5)原件透背叶字迹,有虫蛀、漏洞时,需垫上古籍适用的衬纸后扫描。
(6)分画幅扫描时,各扫描区域边缘必须有3 厘米(含)以上的重复扫描区
(7)数字文件用photoshop软件检查,图像不失真(图像放大至实际尺寸100%)检查清晰度。
(8)数字文件与原件不一致,须先进行色彩校正,再进行重新扫描工作。
6.图像处理:
数字文件的档案典藏级不进行图像处理。图像处理针对图像派生文件的复制加工级和发布服务级文件按以下要求操作处理。
(1)纠偏处理。对出现偏斜的图像进行纠偏处理,对方向不正确的图像进行旋转还原,以符合阅读习惯。
(2)图像拼接。对大幅面文献进行分区扫描形成的多幅图像,服务级文件进行拼接处理,合并为一个完整的图像,以保证数字文件的整体性。
(3)图像剪裁。图像外的边缘裁至0.5至0.75厘米。
(4)不能进行锐化或者图像增强处理,不能更改图像的颜色,尽量减少对图像文件的后期处理。
(5)可按照图书馆要求对指定部分页面添加防泄漏馆藏章水印。
(6)数据图像命名规则:数据扫描时命名的优先顺序分别为: 正文—→目录—→版权—→封面—→书名—→前言。比如目录页占正文页码时应该扫为正文,目录和版权在同一页时扫为目录页。封面页、目录页、书名页、前言页、版权页、正文页、正文中的插页、附录页等扫描文件命名科学,投标书中提供详细的命名规则。
(7)前言、序、题词、出版说明、正文前的彩图等均扫为前言页,后记和跋扫在正文后面。辅助页中不能有空白页存在,正文后的附录、附表、附图、图版均扫为附录。总目、总书目、图版目录、词典的索引、检字表等其它目录也扫在目录里。正文前的索引扫为目录,正文后的索引扫为正文。上册目录已包括下册目录,但下册页号又从一开始,如果下册没有目录的,把上册目录中有关下册内容的部分拷贝一份到下册目录中。上、中、下册的书,页号连续,每册的书名页都需扫描。书名的内容占两页时需要拼图。
7.数据提交:
(1)提交方式:数字化加工数据以移动硬盘形式提交给图书馆。为了防止古籍文献信息数据泄露,双方须签订相关数字化服务协议。
(2)交接手续:数据制作公司填写《古籍数字资源提交单》(附录A),与数据和存储介质一并提交图书馆。图书馆对接收数据进行初步的审核,核查数据类型和数量以及交接单内容,确认无误后签字接收。《古籍数字资源提交单》一式两份,图书馆与数据制作公司双方各执一份。
8.服务方式及地址:本项目要求本地化服务,在图书馆馆舍内指定位置完成全流程数字化服务,严禁纸书及数据流出本单位馆舍以外。
9.验收:
(1)验收方式:图书馆可组织专家进行数据的验收,验收时严格按照国家古籍保护中心的《特色馆藏专题资源建设项目加工及著录规则(2019)》、《古籍数字化工作手册》及国家共享工程的相关要求执行,包括数字化古籍文献整理登记表、描述元数据登记表、管理元数据登记表、图像数据以及说明文件。检查加工数据质量、数据内容是否完整,采取抽样检查方式,由验收专家或者图书馆随机抽样抽检,样本数依据提交数据的总量以及质量确定验收比例。
(2)验收标准
① 送检数据与《数字资源提交单》的内容一致,各种格式数据和数据说明文件一一对应,不可夹杂无关文件。
② 各种标引、说明文件的文字、符号、版式、位置和名称准确,其综合错误率不超过0.3‰。
③ 图像数据扫描方式、扫描规格、文件格式、文件命名、图像处理、压缩方式等符合要求,其综合错误率不超过1‰。
④ 成品数据备份数量、保存介质命名、数据存放方式、数据内容符合规范要求,且各类型保存介质内无坏死文件、不准携带病毒,错误率为0。
⑤ 达到验收标准的数据视为合格,在规定错误率范围内检查出的数据问题由加工单位进行修正;超出错误率、未达到验收标准的数据由加工单位对全部提交数据进行整改、重新数字化等返工处理。
10.安全要求:
(1)参与本项目加工的计算机设备全部在局域网内工作,断绝任何外网连接;
(2)参与本项目加工的全部计算机设备均拆除光驱、软驱,封闭USB 端口。
(3)加工系统的服务器需两个管理员同时在场才能操作,其他任何人不得操作服务器。
(4)加强网络安全,局域网络使用屏蔽双绞线,防止网线电磁传输信息泄露。
(5)数字化工作完成并通过验收后,中标方须将全部资料全部销毁,不得留存。
(6)必须遵守图书馆要求的相关规章制度。
(7)加工流程的各环节交接时,交接双方必须对照交接清单核对古籍及图书的书号及名称无误后方可签字确认交接。
(8)加工过程中允许图书馆工作人员全程监管,防止丢失古籍图书材料。加工现场无关人员不得入内,严格登记制度,门锁钥匙由专人保管,下班前古籍入书库并盘查数量;
(9)加工过程中,须维护古籍历史原貌,不得人为篡改、不得损毁、不得私自带出或丢失。
(10)加工现场严禁吸烟、吃零食,古籍图书附近不得放置水杯、墨水瓶等可能对古籍图书造成污损的物品;
11.质量保障:
(1)错页:图书的页码及内容应相连,不能顺序颠倒、错乱。封面页、书名页、版权页的内容必须一致,目录应与正文相对应。
(2)缺页或删页:正文页、目录页、前言页、版权页、封面页、书名页、插页, 文件名起始页必须从第一页开始且数据内容完整、页数顺序连续,不能出现多页或少页,多余的页要删除。
(3)有关原书缺页的补充规定:如加工的图书原本有缺页,必须在缺页位置补上相应页数文件,页面内容为‘原书缺页’;应使用与原文相同版本的‘原书缺页’样本;如原书正文最后一页明显内容未结束,但目录中最后页的内容正文中没有,应在最后页补原书缺页。
(4)连页压字:页面不能有上下连页严重且已经压字。
(5)不能有压页现象,当页页面上不能有其它页内容或图像。
(6)图像文字不能有明显的彩线或黑线。
(7)歪斜:二值页不超过半个字,照片不超过一个字(以标准正文五号字为标准),但要注意整体效果。所有上正下歪或下正上歪的数据都算不合格。
(8)亮度:亮度验收以50%显示的结果为标准,不能过深或过浅。
(9)去污:所有数据都需去掉馆藏章和手写编号,注意需去污的周边文字尽可能保持完整,不能有缺字、断字现象。去污后的页面以读不出馆藏信息为准;去污后不影响阅读效果的条形码、铅字号都要求去掉,去污时不允许使用整体去污功能,避免造成缺字、断字现象。
(10)重命名: 正文页、目录页、前言页、版权页、封面页、书名页、插页的物理文件名必须按扫描标准的命名规则命名,不能错乱或颠倒.
(11)数据不能有死机、打不开页、黑屏、变形(字体扭曲、字体拉大的幅度超过标准五号字的1/3)等错误。
(12)数据奇偶页的版本必须一致。如因纠偏后造成版本变大的,版面变大幅度最大不能超过原图的十分之一。
(13)旋转:同一本书的文字方向应保持一致,图书数据的方向以文字正方向为准。
(14)无封面:成品数据中如有无封面且没有上交数据说明的,要抽查纸质图书是否确实没有封面。
(二)古籍文献服务平台(系统)建设
1、建设原则
(1)平台要方便高效,做到检索方便、内容展示科学、使用便利。
(2)平台要具有较强的拓展性,为今后资源的更新维护、数据的统计奠定坚实的基础。
(3)平台具有良好的安全性,既是对数据本身的安全保护,也是对平台的安全性保护,做到安全高效。
2、安全体系建设
(1)平台作为在线发布数字资源的媒介,基于数字资源安全性的考虑,必须有版权保护措施,同时保护数字资源不被盗取用作违法传播。
(2)可限制全文开放阅读:支持通过程序配置文件限定阅读页数为前17页或20%,用户如果想继续阅读需要通过提交文献传递申请,经由馆员老师审批同意后读者才可获取全文在线阅读权限。
(3)文献传递管理:支持通过程序配置文件限定单个用户每天最高传递数量5本、每月最高传递数量15本,对于有特殊需求的单位,支持将此限制数量做轻微调整。防止恶意用户非法获得大量资源。
(4)支持账号锁定和解锁:对于异常借阅用户,馆员老师可在后台锁定账号,限制该账号的文献传递申请权限,直到账号解锁才可再次申请文献传递。
(5)平台也可不做全文限制,读者直接在线阅读全文,无须配置文献传递管理规则和账号锁定规则。
(6)平台IP段访问限制:支持通过后台控制功能中的IP范围设置管理,可以将允许访问平台的IP范围添加进入,不在IP地址范围内的无法访问到本平台。
(7)支持数据路径加密:通过对数字资源的显示路径的加密,有效隐藏平台部署的地址及数字资源存储资质,有效防范黑客等人员通过路径查找到资源存储位置进而偷盗数字资源。
(8)接口调用管理:支持给其他平台提供页面阅读接口,在IP范围段内授权调用接口的程序可以直接调用资源页面。
3、功能建设
(1)认证功能
① 支持单位IP地址范围内的用户通过判断IP自动登录获取相应访问权限。
② 单位IP地址范围内的用户可通过验证用户名、密码登录获取相应访问权限。
(2)发布功能
按照数据的分类编号情况发布,方便阅读。
(3)检索功能
① 支持书名、作者、版次字段检索。
② 支持在检索结果中进行二次检索。
③ 支持在选中的分类中检索。
④ 支持书名、作者、出版日期、主题词、分类信息的组合检索。
⑤ 结果排序合理。
(1)阅读功能
① 支持浏览器阅读的方式,用户不用安装插件和阅读器。
(2)数字副本借阅功能
① 支持用户在线提交文献传递申请的表单,经由馆员老师审批同意后即可获取全文数字副本在线阅读权限。
(3)排行功能
① 可根据用户的阅读情况生成Top排行榜。
(4)统计功能
① 提供首页以及阅读页面的访问统计。
② 提供内、外网用户的阅读情况统计。
③ 支持单个IP地址和用户名的阅读情况统计。
④ 支持列表和图表方式展示统计结果。
⑤ 支持统计数字资源副本借阅详情信息的统计功能。
(三)数据对接功能
1.可实现与OPAC系统的挂接
可实现与OPAC系统的挂接,挂接完成后可实现通过OPAC检索到有数据资源的古籍文献时,点击数据资源按钮跳转到平台阅读页面。
本站文章大部分为原创,用于个人学习记录,可能对您有所帮助,仅供参考!
