文 章

中国海关出版社王桦:在必谈“大数据”的时代,我们却开启了“小数据”应用模式

作者:赵慧明(采访)   2018年02月27日   来源:百道网

(点击图片 进入论坛)

【百道编按】中国海关出版社的“海关研库”被选为百道新出版研究院“2017新出版与知识服务年度致敬”的专业知识服务品牌,百道网为此采访了中国海关出版社社长王桦,请她介绍“海关研库”的相关情况。王桦表示,每个系列数据库产品都是一条独立的产品线,年鉴类数据库每年会更新资源,史料数据库和期刊数据库今年都会再增加1-2个独立的专题数据库。每条产品线的纵深发展,共同构成了“海关研库”系列的长远发展。


中国海关出版社社长、党委书记 王桦

百道网:请您介绍一下”海关研库“的情况。“海关研库”在规划的时候有哪些关键的考虑?

王桦:“海关研库”是“海关知库”的一个分支,是一系列为研究提供基础的数据库的总称。专题数据库是专业出版社数字产品的重要组成部分,中国海关出版社是国内唯一的海关专业出版社,但是相对于其他专业出版社来说,成立时间较晚,历史资源较少,而且海关从学科分类来说,并不是一个一级学科,这也导致了海关的专业知识资源并没有其他专业出版社那么多,所以在规划数字产品的时候,我们以建设“小而美”的数据库作为规划原则设计产品。

在这个必谈“大数据”的时代,我们称自己开启了“小数据”的应用模式。因为基于以上的原因,我们的每一个专题数据库体量都不是很大,平均在3000万字左右。当然,这个数据量是在逐渐增加的。

“海关研库”系列数据库的单体数据量都不大,我们在立足出版社自有版权的基础上,通过购买或者合作的方式,积极搜集外部资源,这些资源的用户和渠道都各有不同,我们秉承着以市场为导向建设产品的思路,在整合资源的时候就做了针对性的产品规则。

百道网:它是如何分类的呢?各种分类资源库的情况如何?

王桦:“海关研库”产品共分为四大类,分别是史料系列、年鉴系列、期刊系列三大应用产品和知识服务基础产品,根据资源类型和产品特点进行不同的功能设计,各产品资源唯一独特,功能设计符合使用特点,相互之间彼此支撑,共同构成了“海关研库”的产品线。

比如,史料系列数据库产品是我社的一个特色产品,它源于近代海关由外国人管理的特殊历史背景形成,由于当时的海关职能宽泛,且外国人以严谨的科学态度记录,这批史料目前已掌握的资源总量为6亿字左右,被专家称为“近代史的百科全书”。我社在传统图书出版中只出版了其中约三分之一的内容,在数字化产品规划中已基本整合资源,并采取了“专题开发、逐步上线”的原则,每年推出1-2个专题数据库,目前已建设完成3个数据库、约2亿字的开发量。

该产品采用了当前“数字人文”的设计理念,通过多种工具提供方式,辅助用户使用,2016年第一期通令数据库上线,被学者誉为“国内数字人文领域的最新进展,目前学界能看到的、关于近代中国最好的专题数据库之一,在国际上也处于领先水平”。

再如,海关资源的一个特点就是数值类资源占比较大,我社的畅销书也包括了大量的数值类资源,数值相对于文字来说,其资源使用方式是查询而非阅读,传统出版中将其印刷成册,数字出版中我们则还原了最适合它们的应用,也因此改变了出版机构以图表提供数值的方式,开创了数值类数据库查询的应用方式,并提供查询数据的批量下载和可视化展示,这些应用在年鉴系列的“中国海关统计数据库”和“中国口岸数据库”中都有体现,目前可提供数据量已达1500万余条。

还有,期刊类数据库是我社针对海关20余种期刊(多为内部刊物)的现状分步骤规划建设的,2017年首先搜集整理了《中国海关》、《人民海关》和《海关研究》三种海关历史最为悠久的期刊,这些资源从上世纪50年代跨越至今,我们也是遍寻各地海关整理而成,产品一经上线立刻受各地海关欢迎,上线两个月已经有三分之一的直属海关订购了产品。

海关辞库和海关专业主题词表是为以上数据库提供基础支撑的产品,比如,由于史料类数据库大部分是英文,所以我们就将海关辞库中的近代海关常用词汇内嵌入史料数据库,只要用户移动鼠标至语料库所收录的词汇即可显现释义,免去了用户一边查看史料一边翻阅词典的麻烦;比如,一方面所有的数据库产品是主题词表建设的基础,一方面主题词表建设完成后又精准优化了应用类产品的检索。

百道网:既然中国海关出版社的产品具有上述您提到的数值化特征,那么,融合发展这件事情,在您这里,是否更为紧迫和重要?

王桦:是的,我们领导班子成员十分重视融合出版。我唯一主管的业务部门就是数字出版部,尤其在最重要的资源搜集过程中,我会经常帮助项目人员联系资源供给方,并亲自测试产品提出修改建议。

为了做好融合发展,社里为数字出版业务作了较好的制度顶层设计,规定所有存量传统资源的数字化加工及产品开发统一归口数字出版部,各个部门的协调也非常重要。数字出版部人员各负其责各司其职,产品设计、资源协调、财务保障等工作有条不紊的进行,为工作的顺利开展提供了良好的建设环境。为传统出版内容资源提供增值服务的方式获得编辑部的认可,比如“海关数库”和“边境法规数据库”都是为纸质图书增加了更为便捷的应用,提高了纸质图书的价值。这使得传统编辑也积极参与到数字项目的规划之中。

并且,我们坚持我社主导产品建设。在产品开发过程中以我社为主导,协调资源整理、资源加工以及技术开发,因为产品功能基本都是我社自主设计,需要将各方人员召集到一起商议方案的可行性,不断调试、不断调整,协调各方工作,从小样本资源测试到功能呈现,从功能调整到资源修改,每个产品都是在反复循环中向前推进。通过数据库的建设将一大批外部优质的版权资源签署到社里,不但为社里充实了版权资源,也成为了传统出版内容资源的基础,比如“海关研究”期刊数据库的建设达成了三十年纪念版纸质版本的选题。

百道网:今年在平台和产品的推进上有什么新的规划或大动作?

王桦:每个系列数据库产品都是一条独立的产品线,年鉴类数据库每年会更新资源,史料数据库和期刊数据库今年都会再增加1-2个独立的专题数据库,每条产品线的纵深发展,共同构成了“海关研库”系列的长远发展,随着产品渐成规模,2018年将会在市场拓展方面投入更多的人力,将数字化的转型升级从产品到效益,力争实现海关社社会效益和经济效益的双赢。

(本文编辑:水英)

作者:赵慧明(采访)

来源:百道网

(点击图片 进入论坛)

加编辑群提问

百道学习

随时随地 百道学习

百道学习

点击图片 查看详情

百道学习

百道学习

点击图片 查看详情

相关文章

发表评论前,请先