文 章

中国海关出版社王桦:在必谈“大数据”的时代,我们却开启了“小数据”应用模式

2018年02月27日   作者:赵慧明(采访)

【百道编按】中国海关出版社的“海关研库”被选为百道新出版研究院“2017新出版与知识服务年度致敬”的专业知识服务品牌,百道网为此采访了中国海关出版社社长王桦,请她介绍“海关研库”的相关情况。王桦表示,每个系列数据库产品都是一条独立的产品线,年鉴类数据库每年会更新资源,史料数据库和期刊数据库今年都会再增加1-2个独立的专题数据库。每条产品线的纵深发展,共同构成了“海关研库”系列的长远发展。


中国海关出版社社长、党委书记 王桦

百道网:请您介绍一下”海关研库“的情况。“海关研库”在规划的时候有哪些关键的考虑?

王桦:“海关研库”是“海关知库”的一个分支,是一系列为研究提供基础的数据库的总称。专题数据库是专业出版社数字产品的重要组成部分,中国海关出版社是国内唯一的海关专业出版社,但是相对于其他专业出版社来说,成立时间较晚,历史资源较少,而且海关从学科分类来说,并不是一个一级学科,这也导致了海关的专业知识资源并没有其他专业出版社那么多,所以在规划数字产品的时候,我们以建设“小而美”的数据库作为规划原则设计产品。

在这个必谈“大数据”的时代,我们称自己开启了“小数据”的应用模式。因为基于以上的原因,我们的每一个专题数据库体量都不是很大,平均在3000万字左右。当然,这个数据量是在逐渐增加的。

“海关研库”系列数据库的单体数据量都不大,我们在立足出版社自有版权的基础上,通过购买或者合作的方式,积极搜集外部资源,这些资源的用户和渠道都各有不同,我们秉承着以市场为导向建设产品的思路,在整合资源的时候就做了针对性的产品规则。

百道网:它是如何分类的呢?各种分类资源库的情况如何?

王桦:“海关研库”产品共分为四大类,分别是史料系列、年鉴系列、期刊系列三大应用产品和知识服务基础产品,根据资源类型和产品特点进行不同的功能设计,各产品资源唯一独特,功能设计符合使用特点,相互之间彼此支撑,共同构成了“海关研库”的产品线。

比如,史料系列数据库产品是我社的一个特色产品,它源于近代海关由外国人管理的特殊历史背景形成,由于当时的海关职能宽泛,且外国人以严谨的科学态度记录,这批史料目前已掌握的资源总量为6亿字左右,被专家称为“近代史的百科全书”。我社在传统图书出版中只出版了其中约三分之一的内容,在数字化产品规划中已基本整合资源,并采取了“专题开发、逐步上线”的原则,每年推出1-2个专题数据库,目前已建设完成3个数据库、约2亿字的开发量。

该产品采用了当前“数字人文”的设计理念,通过多种工具提供方式,辅助用户使用,2016年第一期通令数据库上线,被学者誉为“国内数字人文领域的最新进展,目前学界能看到的、关于近代中国最好的专题数据库之一,在国际上也处于领先水平”。

再如,海关资源的一个特点就是数值类资源占比较大,我社的畅销书也包括了大量的数值类资源,数值相对于文字来说,其资源使用方式是查询而非阅读,传统出版中将其印刷成册,数字出版中我们则还原了最适合它们的应用,也因此改变了出版机构以图表提供数值的方式,开创了数值类数据库查询的应用方式,并提供查询数据的批量下载和可视化展示,这些应用在年鉴系列的“中国海关统计数据库”和“中国口岸数据库”中都有体现,目前可提供数据量已达1500万余条。

还有,期刊类数据库是我社针对海关20余种期刊(多为内部刊物)的现状分步骤规划建设的,2017年首先搜集整理了《中国海关》、《人民海关》和《海关研究》三种海关历史最为悠久的期刊,这些资源从上世纪50年代跨越至今,我们也是遍寻各地海关整理而成,产品一经上线立刻受各地海关欢迎,上线两个月已经有三分之一的直属海关订购了产品。

海关辞库和海关专业主题词表是为以上数据库提供基础支撑的产品,比如,由于史料类数据库大部分是英文,所以我们就将海关辞库中的近代海关常用词汇内嵌入史料数据库,只要用户移动鼠标至语料库所收录的词汇即可显现释义,免去了用户一边查看史料一边翻阅词典的麻烦;比如,一方面所有的数据库产品是主题词表建设的基础,一方面主题词表建设完成后又精准优化了应用类产品的检索。

百道网:既然中国海关出版社的产品具有上述您提到的数值化特征,那么,融合发展这件事情,在您这里,是否更为紧迫和重要?

王桦:是的,我们领导班子成员十分重视融合出版。我唯一主管的业务部门就是数字出版部,尤其在最重要的资源搜集过程中,我会经常帮助项目人员联系资源供给方,并亲自测试产品提出修改建议。

为了做好融合发展,社里为数字出版业务作了较好的制度顶层设计,规定所有存量传统资源的数字化加工及产品开发统一归口数字出版部,各个部门的协调也非常重要。数字出版部人员各负其责各司其职,产品设计、资源协调、财务保障等工作有条不紊的进行,为工作的顺利开展提供了良好的建设环境。为传统出版内容资源提供增值服务的方式获得编辑部的认可,比如“海关数库”和“边境法规数据库”都是为纸质图书增加了更为便捷的应用,提高了纸质图书的价值。这使得传统编辑也积极参与到数字项目的规划之中。

并且,我们坚持我社主导产品建设。在产品开发过程中以我社为主导,协调资源整理、资源加工以及技术开发,因为产品功能基本都是我社自主设计,需要将各方人员召集到一起商议方案的可行性,不断调试、不断调整,协调各方工作,从小样本资源测试到功能呈现,从功能调整到资源修改,每个产品都是在反复循环中向前推进。通过数据库的建设将一大批外部优质的版权资源签署到社里,不但为社里充实了版权资源,也成为了传统出版内容资源的基础,比如“海关研究”期刊数据库的建设达成了三十年纪念版纸质版本的选题。

百道网:今年在平台和产品的推进上有什么新的规划或大动作?

王桦:每个系列数据库产品都是一条独立的产品线,年鉴类数据库每年会更新资源,史料数据库和期刊数据库今年都会再增加1-2个独立的专题数据库,每条产品线的纵深发展,共同构成了“海关研库”系列的长远发展,随着产品渐成规模,2018年将会在市场拓展方面投入更多的人力,将数字化的转型升级从产品到效益,力争实现海关社社会效益和经济效益的双赢。

(本文编辑:水英)

来源:百道网


百道学习——中国第一个书业知识服务平台

精品课程试听


【新出版与知识服务】

网络时代的出版通识课  知识服务的知识服务

出版与融合 | 新出版的第一个关键词

为什么付费订阅专栏比超级畅销书还要赚钱

为什么电子书最终没有革掉纸质书的命,知识付费产品却有可能?

元数据比大数据更重要

为什么EPub不如PDF成功

新模式:罗辑思维的图书进化史

得到精品课的内容定位


【书店商学院】

网络与跨界时代的书店通识课

上班路上八分钟  书店经营变轻松

书店正在发生怎样的变化?

书店+文创店,构建集创意、生产、体验、销售一体的平台

为什么书店需要通过选品和展示来制造惊喜?

你的书店会请会员免费喝咖啡吗?

天猫超市为什么让我们一分钱换购商品?

茑屋书店是如何做导购员制的?


【畅销书策划与运营】

五大畅销书工场内部培训秘籍

营销篇:两篇文章引爆15万册销量?

选题篇:三步搞定选题开发

《从0到1》:一场因意外错误导致的创新

想做畅销书吗?先连续看12个月排行榜


【编书的功课】

资深编辑人教你的

最值得学习与传承的编辑工艺与手艺

编辑要离潮流远一点

当要请作者修改或直接退稿时,怎么办?

给书起名字(一)

给书起名字(二)


【精品出版】

聂震宁亲授精品出版理念与方法

谁来催生精品书

态度决定精品书

用精神和品德团结作者


【天天听好书】

帮每个书店人轻松发现和推荐好书

《字看我一生》

《数据的本质》

《安全简史·从隐私保护到量子密码》


【咖啡馆商学院】

咖啡女王教你如何做有颜值还赚钱的咖啡馆

不同城市对咖啡馆的定义不同/城市定位

妈妈们撑起半边天/社区店

你的餐品与西餐厅相比有优势吗?/咖啡+西餐

如何有效地节省房租/选址技巧

第20讲 便宜背后往往都是陷阱/选址陷阱


我们等待看好知识服务未来的童鞋——

百道学习是针对出版发行业的知识服务平台

是最领先的知识服务模式在出版业的垂直应用

知识服务是出版转型的未来

百道学习是“知识服务的知识服务”

转型知识服务,从百道学习开始

无论是编辑、运营和营销,我们都欢迎!

简历投放:guoxue@bookdao.biz


百道学习

随时随地 百道学习

相关文章

发表评论前,请先