古籍图像数据采集流程和技术规范.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
古籍图像数据采集流程和技术规范

古籍图像数据采集流程及技术规范 一、数据统计 扫描前对古籍进行浏览整理,填写数据统计表,作为后续质检工作的依据。 1.数据统计包括如下项目: 册数 页数 行数 每行字数 每页字数 书长 书宽 边框长 边框宽 备注 联目号 2.页数包括书皮和扉页在内。 3.古籍的特殊装帧形式及版式在备注栏中注明。例如版式上有层楼现象;有页眉、页脚的现象;存在缺页、残页等现象。 4.书代码由总课题组负责分配,无需填写。 二、外观图像采集 1.图像采集范围: 对每一册书的六个平面分别进行拍照(正面z、背面b、书脊j、书心x、书脑n、书根g)。如有书函,对书函的处理原则同上。 2.图像命名规则: (1)册号+平面名 (2)例如:第二卷的背面命名为:0002b 3.操作要求: (1)光线适度,图像中不可有阴影。 (2)拍摄角度保持水平。 (3)古籍旁设置标示方位的标尺(上、下、左、右)。 4.照片尺寸: 不低于3264×2448。 5.凡能够反映古籍版本信息的内容,均应酌情采集图像信息。处理原则同上。 三、图像扫描 1.图像扫描范围: 需要数字化的图像和需要使用的图像(比如正文和书皮)。 2.图像DPI: 不少于300DPI。根据原图像的清晰度及其数字化识别率的测试情况来选择。 3.图像模式: 全彩图像。 4.亮度、对比度: 根据书页纸质的不同,扫描过程中作适当调整。 5.图像格式: 图像保存为TIF格式。 6.图像扫描顺序: 按原始数据的先后顺序扫描。 7.操作要求: (1)扫描需尽量做到端正,书页尽量贴合扫描仪的板面,用力均匀。 (2)保证扫描内容的完整性。 (3)保证字迹清晰不扭曲,图像边缘无畸变。 (4)每扫完一页后及时检查。 8.对于有缺页的古籍,按照所缺的页数,插入相应的空白页。 四、检查校对 1.检查扫描页的质量。 2.核对每册扫描页的数量(与统计表核对)。 3.与原书核对扫描顺序。 4.与原书核对扫描内容(保证内容完整)。 五、图像整理、命名 1.图像整理标准: (1)若原始数据有边框,则图像整理时保留边框。 (2)若原始数据无边框,则图像整理时在文字列最外围保留一定的空间。 (3)确定图像裁剪大小的统一标准。 (4)图像裁切时注意保留原有的眉批、尾注和书口。 (5)裁切图片时要求同一本书的所有图像尺寸大小保证一致。 (6)整理后的图像必须为黑底白字。 (7)整理后图像的倾斜度为零,以保证图像横平竖直。 2.图像命名规则: (1)书代码+册号+页号+(a/b) (2)例如:《温病条辨》第一册第一页正面命名应为:000100010001a (3)为保证代码位数的统一,规定如下: 书代码、册号、页号统一规定为4位。 六、图像整理质检 对整理后的图像进行质检,看是否合乎图像整理规范,并与原始数据进行核对(顺序、内容),保证图像的质量和数据的完整性。 七、图像管理 整理后的图像格式为:*.TIF、G4无损压缩。 注:子课题组上传的文件应包括四个:古籍数据统计表、外观图像采集的照片、原始的图像扫描件、图像整理命名后的扫描件。 《温病条辨》书代码为0001

文档评论(0)

ktj823 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档