摘要:作为出版形式的数据库,在出版史上具有范式转移意义。数据库出版开拓了出版新边界,创造了检索发现内容模式、复制与传输合一模式、平台型按需出版模式,在此基础上创建了全新的商业模式。数据库出版新范式的深度意义体现在:数据库出版作为新出版形式重构了出版价值链,构建了全新的出版格局;数据库出版作为新业态,构建了全新的数字出版业态;数据库出版作为新商业模式,构建了全新的出版生态。
显然,数字出版颠覆了以纸介质为基质的传统出版模式。如果借用托马斯·库恩的范式理论,此次出版巨变属于典型的范式转移。如果从深度和广度去衡量,本次范式转移远超雕版印刷术、铅活字机械印刷术以及工业印刷机带来的出版革命。本次出版范式转移源于计算机技术,如果没有计算机的发明就不会有其后的数字出版。伴随计算机技术发展而来的是数据库技术,其核心是数据的组织、存储、处理和管理,是计算机技术的重要组成部分和具体应用。而数据库技术恰恰是数字出版的基石。世界上公认的数字出版的开端是1961年美国化学文摘服务社(CAS)使用计算机编制的《化学题录》(Chemical Titles),此数字产品实际上就是书目形式的数据库出版物[1]。也就是说,数字出版的第一种出版物就是数据库产品。
数据库是持久存储在计算机内有组织、可共享的数据集合[2]。而从数据库技术演化而来的数据库产品,实质上就成为出版概念下的一个出版品种或出版门类。所谓数据库出版,可以定义为“借助计算机或类计算机设备及数据库技术,将不同形式存在的符号系统经过系统或有序的编码,存储于磁、光介质中并形成可通过计算机或类计算机设备加以获取的数据库产品的出版活动。”[3]在此之前,人类出版史上从未有过此种形式的出版产品。数据库出版物的诞生,毫无疑问改写了人类的出版史。因此,研究与考察数据库在出版史上的范式转移意义,具有重要的理论价值。
本研究拟从数据库出版边界、呈现方式、复制和传播模式、按需交互模式、商业模式和历史地位6个方面展开讨论。
以纸为基质的出版内容全部装载于纸的幅面上。纸的局限显而易见,只能承载文字和图像,用文字和图像表达的内容就是纸质出版物的边界。数据库的载体介质则完全不同,其常见的载体介质为磁盘存储器(机械硬盘和固态硬盘)、闪速存储器(U盘和移动硬盘)、主存储器(内存)、光学存储器(光盘,如CD、DVD)、磁带存储器(磁盘)等,介质基质为磁和塑料。新载体材料颠覆了纸介质承载内容的方式,从而彻底突破了纸的限制。从理论上讲,凡是数字化的内容均可以装载于数据库中。狭义地看应用于出版领域的数据库,其内容边界不仅全部覆盖传统内容,并且前所未有地扩张了出版的新边疆,至少在3个方面是前无古人的。
1.1 由数据库内容表达符号的扩张带来了新的出版内容形态
数字技术不仅使文字符号和图像符号转化为数字内容的表达符号,更带入新的符号系统,如计算机图形、音频和视频一并成为内容表达符号。新符号系统使得以前不能在纸上表达的内容开始大规模地进入出版领域,如技能、动作和课程。传统上,技能需要面对面的交流,才能将经验传递给对方。在数据库中,通过视频和音频就可以完成经验传递。同理,各种需要动作来演示的知识,如实验室的环节步骤,均能由音视频来表达。随着5G和传输技术的进步,各种课程与演讲内容已经成为教育出版平台的主流内容。AR技术和VR技术使得用计算机图形可以纯熟地呈现虚拟内容,彻底刷新了传统出版观。当下,音频数据库、视频数据库和多媒体数据库的内容总量已经极大超过文字与图像数据库的字节总数。
1.2 由数据库特殊的内容组织方式带来了新的出版方式
数据库的内容组织方式主要有层次结构、网络结构、关系型结构、面向对象结构、面向对象关系结构,由此而形成关系型数据库、非关系型数据库、图数据库、多模型数据库、层次结构数据库、网络结构数据库等,这些内容组织方式各有特长,适用于不同的应用场景,但是,其底层逻辑都是将内容完全颗粒化,因此,各种数据和信息成为越来越重要的出版对象。各种即时数据和即时信息已经成为数据库出版内容,如彭博金融数据终端数据库、全球专利文献数据库、全球新兴市场商业数据库、国际货币基金组织统计数据库等,这些内容用纸质形式出版是不可想象的。
1.3 由数据库技术带来的内容扩张可触达所有的文献资源
数据库是从仓库概念引申而来的,只不过数据仓库里装载的是数据而已。以什么样的方式组织、整理、存储和管理数据则需要技术,这便是数据库技术。在数据库技术的不断演化过程中,催生了不同类型的适用于不同应用场景的数据库。具体到出版领域,基于文献资源的数据库类型主要有:书目数据库、全文数据库、引文数据库、事实数据库、数值数据库、多媒体数据库、工具和参考数据库、其他特殊类型数据库。相应地,这些类型的数据库可以出版上百种类型的文献内容,如书目、目录、电子图书、电子期刊、电子报纸、会议论文、学位论文、法律法规、文摘、索引、事实数据、技术报告、地图、图片、音频、视频、课件、标准、预印本等。这些内容在纸质出版物时代,是很难正式出版的,即便公开出版,也多是一过性的,但数据库则能够全部追溯性地整体呈现,从而将出版的触角伸向广阔的处女地。
整体可视化是纸质书籍的一大特点。一本纸质书籍由封皮和内文页装订而成,可以拿在手上随意翻页,其整体性一览无余。但数据库出版物则彻底颠覆了封装型书籍的呈现形式,其内容与呈现的屏幕是分离的,读者只能看到通过检索而呈现在屏幕上的内容,并且不能随意翻页。因此,数据库改写了出版的呈现方式,创造了由可见可视到检索发现内容的根本性转向。
2.1 数据库的内容呈现方式具有变量特征
数据库以电子形式存在,可以通过多种展现形式如表格、图形、报表、地图及数据可视化工具等进行展示,相较于纸质书籍以文字和图片形式展示,其可变量广度大为增加。与纸质书籍一旦印刷为成品,其内容则被固定下来,不能再做增、改、删等改动,而数据库则全然不同,其内容则可以实现实时更新,随时可以增添或删除,数据库内容的动态性与纸质书籍的固定性截然不同。动态的内容呈现形式极大增强了数据库出版的表达力和竞争力,将变量因素引入出版产品改写了书籍出版的传统模式,内容的可变性从而成为数据库出版的重要特征。同时,数据库内容的动态化无形中拓展了它的多元化应用场景。
2.2 数据库的内容呈现方式具有应用场景化特征
数据库内的数据按一定的数据模型组织、描述和存储,具有持久存储、有组织和可共享的基本特点,数据库系统历经数代的迭代,目前已经可以广泛应用于一切与数据处理有关的应用领域,如电子商务政务、地理信息、数字图书馆、数字博物馆、银行税务信息、远程教育、医学信息、农业信息、科学数据等,均可以用数据库形式实现。数据库的内容呈现方式可以根据用户的不同应用场景而进行个性化设计。数据库内容主要的呈现方式有表格形式、图形化界面展示、报表形式、网页形式、地图形式、图像形式、数据透视表形式、数据仪表盘形式、数据流形式、数据导出形式、API接口形式等。数据库内容呈现的灵活性是纸质书籍所不具备的。
2.3 数据库的内容呈现方式具有检索发现特征
与纸质书籍的直观呈现截然不同,数据库内容只有通过关键词或类关键词检索搜索或查询才能实现呈现。存储于数据库内的数据信息按照多种逻辑表达式组合为检索项,如对文字、图片图像、音视频信息进行多重定位,其检索项包括名称、主题、来源、作者、创建者、出版者、日期、类型、标识、格式、版权等。数据库内容检索类型主要有全文检索、结构化查询、关键字检索、布尔逻辑检索、范围检索、模糊检索、正则表达式检索、地理位置检索、元数据检索、语义检索、图形检索、全息检索、索引检索、分区检索、搜索引擎集成检索、云数据库检索、跨库检索等方式。换言之,数据库的每一种检索方式都是其内容的一种呈现方式。见树不见森林应是数据库内容呈现的最大特征。
纸质书籍的印制和发行是两个线性的相递环节,严格说来,是出版活动中两个独立的系统,分别承担着不同的功能,二者的区分十分明显,不仅存在较长的时间间隔,并且存在于不同的地理位置。但在数据库出版中,编码和存储于数据库中的内容信息是可以同时共享的,不同的用户可以同时访问同一种内容,数据库管理系统可以同时生成千万个副本并几乎同时传输给不同的用户。在数据库出版中,数字内容在复制的同时就能进行传输,无需像纸质出版中先复制再分发,这种内容复制和传输合一的模式是对传统出版的一种超越。
3.1 数据库出版构建了出版传播新模式
基于工业印刷机的传统纸质出版由出版、印刷和发行三大系统构成,而基于计算机技术的数据库则改变了传统的出版结构,主要体现在3个方面:①印刷环节被复制替代。数据库内容为编码的数字格式,其内容从主数据库转移到用户终端只需下载、复制、粘贴、保存即可完成,不再需要将内容转移到纸上这个环节。②发行被传输替代。纸质书籍依靠交通运输的物流才能完成异地传递,而数据库内容传递在两台计算机或类计算机之间完成,依赖的是移动硬盘、固定互联网和移动互联网,传统的发行模式失效。③内容复制和传输走向合一。在计算机技术、互联网技术和通信技术的合力下,数据库内容从用户提出需求,数据库管理系统会自动从存储位置复制所需的一个副本,此创建副本会通过网络立即传输到用户的设备上,复制和传输几乎同时发生,用户感知到的是时间上的无缝连接。在内容复制和传输合一的技术背景下,数据库出版机构的权重增强。
3.2 数据库出版构建了内容并发新场景
无论是在线教育平台、专业学术平台、网络文学阅读平台,还是智能手机、平板电脑、手持阅读器,其后台全部是装载着不同内容的各种类型的数据库。在云存储、云计算与大数据处理模型下,海量内容被集中存储和处理,当用户请求访问或操作这些数据时,大数据管理系统会根据需求自动进行数据的复制和传输,生成数据副本并将其从存储层传输到应用层,基于这一技术特点,数据库出版创立了内容并发模式。所谓数据库内容并发模式,是指在大数据环境中,多个用户或进程同时访问和操作数据库的方式。在实际的数字出版应用场景中,数据库内容并发已经是最基本的应用模式,如网络文学平台,同时阅读一本网络小说的用户可以达到千万级的水平。相较于纸质书籍的一人阅读,跨地理空间的百千万人可以同时阅读一本电子书籍的场景,无疑是一场阅读革命。
3.3 数据库出版形成了出版成本新结构
在传统纸质出版中,印制成本和发行成本是一本书的主要成本。一本纸质书籍的直接成本包括作者版税、印制成本和发行成本,间接成本主要为出版机构人力成本和管理成本。数据库出版成本主要包括硬件成本、软件成本、人力成本、管理成本、维护成本。二者比较而言,数据库的成本前移到创建数据库的初期,一旦开发完成,其复制和传输的边际成本几乎可以忽略不计,因而节省了纸张印刷成本、物理仓储成本、物流成本和发行成本。数据库出版成本优势还体现在内容多次开发和增值、精准营销提高营销效果、无退货成本、人员配置成本降低等。数据库出版构建的成本结构为:前期制作成本,包括内容创作与编辑成本、数据录入与整理成本;技术成本,主要为硬件设备成本和软件成本;运营成本,包括网络带宽成本和数据安全成本;营销与推广成本,主要为市场调研成本、广告与宣传成本;更新与维护成本,主要是内容更新成本和系统优化成本。
数据库技术先于互联网技术诞生,它是互联网的技术基础。但互联网进入商业应用后,反过来对数据库技术提出了更多更高的需求,二者的紧密结合加速了数据库出版的升级迭代并催生了数据库出版新模式。表面上,互联网是客户端,但其内里却是数据库。同理,数据库呈现给用户,需要借助互联网和计算机屏幕触达。
4.1 数据库开创互联网平台出版模式
早期的数据库内容呈现借助磁盘和光盘介质,将磁盘或光盘插入计算机在计算机屏幕上读取。固定互联网诞生后,数据库内容通过互联网传输到计算机,用户在计算机屏幕上读取。移动互联网普及后,获取数据库内容的途径增多,智能手机、平板电脑和专业阅读器均成为读取数据库内容的终端。反过来说,数据库内容触达用户需要一个便捷的普及率高的大众化的平台,而互联网平台恰好满足了这一需求。二者的结合,开创了以后台数据库为内容、以互联网前端为平台的出版模式。如美国化学文摘社学术总平台、COAJ中国科技期刊开放获取平台、万方数据知识服务平台、维普期刊资源整合服务平台等,均是依托互联网平台而创建的数据库出版模式。进入移动互联网时期,数据库平台则以App形式呈现,如手机知网、人大复印报刊资料、全球学术快报、国家哲学社会科学文献中心等。
4.2 数据库开创数据信息增值服务出版模式
纸质书籍售出后,读者如何获取和如何阅读此书、如何接受此书和如何从此书中获益则完全不在出版社的掌控之内。数据库出版则改写了传统出版模式,它以提供诸多的增值服务而提高了用户的忠诚度和效率。事实上,数据库出版正在从内容提供商转向信息服务商。数据库出版所提供的增值服务主要集中在两个方面:服务工具和解决方案。能够给用户提供的服务工具主要有数据分析与挖掘工具(统计分析功能、关联分析功能、数据预测)、可视化工具(图表生成、图谱绘制)、文献管理工具(参考文献生成、文献标注与笔记、文献分享与协作)、智能检索工具(语义检索、跨库检索、高级检索)、学术交流与互动平台(在线论坛与社区、专家咨询服务、学术活动信息发布)等。能够给用户提供的个性化解决方案主要有个性化内容推荐服务方案、个性化数据筛选排序定制方案、个性化提醒服务、个性化学习解决方案、个性化研究解决方案等。
4.3 数据库开创用户按需出版模式
在大数据技术背景下,本研究从两个层次理解数据库的按需出版特性。
(1)数据库技术应用之一的数字图书馆或数字资源库的电子格式文件与按需印刷技术结合,根据用户需求,可以即时将任何一本电子格式文件印刷为纸质书籍,这种方式可称为按需出版或即时出版。同理,以PDF格式存在的电子书籍随时都可以根据用户需求而印制为纸质书籍。
(2)依托数据库内存储和管理的数字内容,根据用户需求,如用户对某一特定主题、特定格式、特定时间段等出版内容提出请求,数据库管理系统即能从数据库中提取相应的内容,快速生成满足用户个性化需求的数字出版物。如学术出版可以从数据库中提取同主题论文形成一本论文集或学术资料集。如教育出版,可以从在线教育数据库中提取用户所需要的内容形成一对一的个性化学习解决方案。在大众出版领域,可以根据用户需求从网络小说数据库中提取任何一部小说供用户阅读。
纸质书籍出版是以直接销售产品为盈利模式的。单本书销售是主要特征。数据库的盈利模式与纸质书籍出版则全然不同。数据库出版商的商业模式基点不仅是产品和内容,它更基于技术和服务。基于此,数据库出版商开拓了除售卖数据库产品之外的更多类型的盈利模式,如提供数据库技术服务、提供数据库定制解决方案和增值服务、提供订阅服务、获取广告收入、获取机构赞助等。数据库出版中最常见且盈利的商业模式主要有3种类型。
5.1 数据库订阅模式
从技术而言,数据库订阅模式是发布与订阅同步模式,是一种高效的数据同步和分发机制,是内容发布和消费者接收的信息传递机制。从商业角度看,数据库订阅盈利模式是一种以定期订阅为基础的收费方式,用户通过付费订阅获取数据库相关内容和服务。订阅模式的类型主要有两种:按使用时间订阅和按功能级别订阅。订阅的主体分为机构订阅和个人订阅。机构订阅是数据库盈利模式的主流。大学、研究机构、公司或政府机构等通过支付按月、季度、年度订阅费获取数据库的访问权限。订阅费用的标准通常基于机构的规模、用户数量和访问频率,同时还会参考订阅范围,如全库订阅、期刊为现刊或过刊、主题集数据大小等因素,收取不同的费用。大多数数据库出版商的电子期刊和电子图书数据库采用订阅模式。订阅模式使用户拥有了更高的灵活度,使数据库出版商获得了持续稳定的营收。
5.2 数据库按需付费模式
数据库按需付费模式是一种灵活的计费方式,用户只需根据实际使用的资源付费。具体来说,就是用户按需购买单篇文章、书籍章节或其他内容,而无需订阅整个数据库。大多数数据库都支持按需付费方式,如Springer Link、EIsevier ScienceDirect、Wiley Online Library等。单篇文章购买的价格相对较高,一般在30美元以上,如爱思唯尔的论文每篇为31.50美元,但相对于购买整个数据库依然是节省费用的。这种模式的优势在于:用户可以根据自己的研究或工作所需而选择性地为高质量的内容支付费用,从而可以有效地减少资源浪费、节省成本;而就数据库出版商角度而言,由于为用户提供了更加灵活的选择和控制,因而带来了更多的市场机会、用户黏性和更多营收。
5.3 数据库开放获取(OA)模式
OA模式是国际学术界、出版界、图书馆界为推动科研成果充分利用互联网免费传播而推动的一种出版传播行动,其核心是基于互联网在作者授权的前提下任何人都可以及时、免费、不受任何限制地通过网络获取各类文献。其形式有开放存取期刊和开放存取仓储两种。其盈利模式主要有:①文章处理费,由作者或其所属机构、资助方支付,用以支付文章在出版过程中产生的成本,包括同行评审、文章制作、排版编校、在线出版、在线服务等。国际上的大出版商纷纷推出此模式的数据库产品,收费标准不一。②数据库平台订阅费或个人会员制费用,面向机构主要为订阅费,面向个人主要为会员费。③广告与赞助收入,一些学术搜索引擎或资源平台在平台上投放产品、会议、培训等广告,一些非营利组织或基金会为支持开放获取出版而提供资助。④数据销售与增值服务,除直接销售数据库产品外,开放存取平台还可以为作者提供论文润色、语言翻译、数据分析等服务,为科研机构提供科研项目管理、学术影响力评估等增值服务,以此收取适当费用。⑤知识产权授权费与内容复用与整合费,平台为用户提供专题报告、学术数据集、电子书籍等整合型产品,收取一定费用。⑥通过举办学术会议、开设培训课程收取费用或赞助。
整体来看,数据库开放获取的盈利模式实际上是一种混合模式,覆盖了前两种盈利模式。事实上,大多数数据库出版商走的都是综合性的盈利模式。
数据库出版引发了知识生产范式的结构性变革。具体来说,数据库出版重建了知识组织方式、生产方式、呈现方式、传播方式和使用方式。它所带来的结构性变革,在出版史上可以与印刷术的发明相媲美,具有承上启下的历史作用。数据库出版不仅是由第四次工业革命中关键技术驱动的全新出版形式,更是数字出版的底层基础,同时,它还是未来智能出版的核心引擎。
6.1 数据库出版继承了纸介质出版的本质特征
数据库出版在内容生产方式革命中居枢纽地位。从出版史的视角看,我们发现,数据库出版尽管开创了数字出版时代,同时,也保持了出版的本质特征。从出版的功能、属性和作用等多个方面探究出版,我们认为,出版具有信息、知识和思想筛选、固化、组织、传播、交流、传承、教化、娱乐、评价、创造、创新等功能。概括说来,出版是知识生产的系统性封装工具、知识传播的中介性转换工具、社会功能的制度化服务工具,从这3个维度分析,数据库出版虽然带来了数字技术、数据化和智能化变革,但它依然赓续和保持了出版的核心价值和本质。
换言之,数据库出版改变的只是知识组织、生产、呈现、传播和使用方式,但它并没有改变知识生产的系统性、知识传播的中介性和知识服务社会的出版本质,也就是说,数据库出版依然属于出版的范畴,它在出版史上起到了承上启下的作用。
6.2 数据库出版重构了出版的底层技术和基础
在赓续传统出版的同时,数据库出版重构了知识的存储、传播和使用方式并深刻地改变了人类的认知模式和社会运行机制。从技术的角度来看,相对于纸质出版,数据库出版具有数据驱动性、可计算性、动态更新性和互动性特点,它给出版业带来了载体、生产和传播三重革命。数据库出版依托计算机技术和网络技术,通过结构化数据模型,实现了内容结构组织从章节细化为颗粒化的关键词,内容存储实现了海量化、动态化、多维关联和实时更新,内容生产模式转向各环节数字化协同,内容传播形态转型为不同层级的互动式网状结构。
随着数据库技术的不断迭代,诸多数据库技术标准共同构成数字出版的底层架构。可以说,数据库出版不仅是数字出版的开创者,也是所有数字出版类型的技术基础设施。
6.3 数据库出版从多个维度重塑数字出版未来方向
数据库出版是典型的由技术驱动的出版范式转移。它作为数字出版的基础性技术特征,在“技术–知识–社会”三维互动的现实场景中,将依然是推动和引领未来出版的动力源。在技术赋能的宏观背景下,大数据技术、分布式存储技术、区块链技术、量子计算技术、生成式AI技术、数字孪生技术、脑机接口技术、元宇宙技术等新技术,将推动出版不断更新应用,如量子数据库将驱动知识发现实现突破,元宇宙技术将再造虚拟学术空间,语义搜索和智能检索推动知识个性化服务,人机协同学术生产将成为重要的知识产出模式。从未来的发展来看,基于数字出版应用的数字技术和数据库技术已经出现诸多拐点,如DeepSeek的生成式能力、光子量子计算机等技术突破将重塑出版基础设施,数字出版在经历文本电子化、多媒体交互后,数据驱动智能出版的趋势越加明显,大数据出版、语义出版、知识图谱出版、生成式AI出版,甚至基于脑机接口技术的更加个性化的神经认知出版将逐步登上数字出版的舞台。
总体来说,数据库出版标志着人类出版史进入数字出版新纪元。它上承纸质传统出版,下启未来的神经认知出版,在出版史上具有不可估量的作用。其历史地位和范式影响力,我们可以用图1来直观呈现。
数据库作为一种出版形式登上出版舞台,对出版业产生了颠覆性的深远影响。通过对数据库出版5种新模式的研究与分析,本研究对出版新范式的深度意义做一些结论性的思考。
(1)数据库作为新出版形式重构了出版价值链,构建了全新的平台型出版格局。传统的出版、印刷、发行三大系统被数据库出版商所构建的融出版、复制和传输三位一体的平台所替代,价值链的新范式趋向内容、应用工具和增值服务融为一体。以数据库出版为代表的数字出版价值链模糊了出版、复制和发行渠道的边界,解构了传统纸质出版中的作者、读者界线,读者演化为用户,用户也成为作者,用户作者化和作者用户化重构了知识生产流程和利益分配格局,平台成为出版载体并重构了知识生产关系、重塑了传播生态、再造了出版产业价值网络。
(2)数据库出版作为新业态,构建了全新的数字出版业态。以计算机技术、信息技术、数字技术、互联网技术、通信技术、人工智能技术等技术为基础的数据库出版,在引入计算机图形、音频、视频符号系统进入出版应用的前提下,在内容资源方面不仅覆盖了人类有史以来过往的所有出版物资源,同时还将出版的触角伸向所有可以用数字表达的资源类型,并且使内容呈现转向按需、即时、所求即所得的、融复制与传输为一体的检索发现模式。
(3)数据库出版作为新商业模式,构建了全新的出版生态。从销售内容产品(数据、信息、知识)到提供订阅、按需付费、技术工具、增值服务和广告服务,数据库出版的服务触达信息社会的各个角落,由此而极大地增强了出版的功能。数据库出版使得人类社会可以无限量地记录和存储、传承和传播内容资源对象,它创造了新的知识和学术交流模式,它重构了教育体系和科学研究体系,它以全新的盈利模式成为数字出版的核心引擎,推动了数字经济中的创意与创造、发现与发明,从而为构建知识社会贡献出版力量。
作者简介
耿相新(1964— ),男,1985年毕业于北京师范大学历史系,编审,主要研究方向为出版理论、出版史、书籍史。发表学术论文60余篇,出版学术论著和诗歌作品集10余部。
发表评论前,请先[点此登录]