近日,第十届中国数字出版博览会2019-2020年度荣誉推介授牌仪式在北京举办,内蒙古出版集团有限责任公司基于DCR技术的蒙古文PDF编码转换技术获得2019-2020年度·创新技术荣誉称号。
为推动蒙古语言文字的数字出版,内蒙古出版集团信息中心选择PDF文件格式作为编码转换的中间格式,同时采用创新的DCR技术的PDF编码转换技术,既提高了转换的准确性,又尽可能地降低了人工校对的工作量,是海量资源编码转换的理想选择。
据了解,在此项技术出现之前,蒙古文信息化建设和应用受制于呈现形态单一、内容无法检索、无法复制应用和无法应用到移动端等问题,信息化建设工作一直未能走出困境。但是随着DCR技术的应用,海量的蒙古文PDF可以快速、高效、准确地转为国际标准编码的PDF文件,为后期进行结构化加工和知识化加工铺平了道路。
据内蒙古出版集团相关负责人介绍,摆脱了非标准编码限制的蒙古文PDF文件,将促进数字出版在移动阅读、蒙古文知识服务、蒙古文教育、蒙古文职业培训等方面的长足发展。
此项编码转换技术还获得两项软件著作权登记证书,“蒙古语言文字数字资源建设与共享工程”项目应用此技术成果完成了7000多种图书资源的加工工作,为存量资源的数字化加工以及项目顺利实施提供了强有力的技术保障。(内蒙古日报社融媒体记者 杨婷)
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。