2023年开年的时候,ChatGPT的爆发,给了所有人惊喜和惊恐:是否有一天,AI会替代甚至统治人类?当时我采访了一位作者,问了他一个问题:ChatGPT开年爆火,是否意味着AI创作将大举来袭,卷遍文化和科技互联网,还是像流星一样火一阵儿就消失了?他回答说,这一次ChatGPT火爆的时间可能会比想象中长很多,它是一次对互联网内容生产力的变革,同时也会作为底层基建接入到各行各业中去加以应用,并不像之前AlphaGO火爆时针对的应用场景那么窄。
一年过去之后,ChatGPT已经迭代了多次,每次迭代似乎总能引起一些“骚动”,但已经不再像当初发布那样激动人心。就连Sora这样颠覆性的人工智能文生视频大模型也在最初的惊艳之后迅速安静了下来。从区块链、元宇宙、AIGC,再到大模型,概念更迭的速度,让人眼花缭乱,也让参与者手忙脚乱,这一波还没有搞清楚,下一波又来了。新技术、新产品给每个人、每家企业都描绘了一个诱人的前景和场景,但大家总在追赶,却很难落地。
5月31日,人工智能企业第四范式董事会主席兼CEO戴文渊在2024财新夏季峰会上表示,2024年各方对待AI(人工智能)的态度,有望从非理性狂热回归理性。行业可能会减少对算力、参数的过度关注,转向推出更多能够为各行业降本增效的垂直行业大模型。一些客户对模型是否涌现、参数规模有多大等信息表现出过度关注。“当一个新技术开始火热的时候,大家就忘记自己本来是做什么的了。”
6月3日,一家名为神龙数藏的数字藏品运营平台跑路了,而且还嚣张地发布了一个公告:“我们跑路了,天下没有不散的宴席,这场盛宴已经到了最后的时刻,山珍海味早就已经吃完了,只剩下满地狼藉,聪明的人已经吃饱了悄然离席,你后知后觉的仍不愿离场,拿着筷子把碗敲的叮当响,幻想期待下一道美味丰盛的主菜,结果最终迎来的是这场盛宴巨额账单,盛宴总要有人买单,而这次又是你买单。”
盛宴,总要有人买单。
出版业对AI的向往毋庸置疑。有公司躬身入局投资AI相关企业,有公司开拓AIGC业务,有公司甚至从AI中挣到了一些钱。但整体看来,依然大势未成。以前我们经常开玩笑,一个新机会出现的时候,最先挣到钱的不是真正的从业者,而是那些“布道者”,他们不入局,却从希望入局者身上掘到了第一桶金。等下一个机会出现时,他们再次变身成新机会的“布道者”掘金。
出版业对AI其实也充满了困惑。互联网大厂们一拥而上,似乎凭借一己之力改天换地,但现实却总是不尽如人意。要想All IN,但这个投入产出比一个小小的出版行业能够承受的。在刚刚结束的一场财报电话会上,微软首席财务官Amy Hood表示,公司在云计算和AI相关的基础设施投资,可能需要15年甚至更长时间才能获得回报。
出版业总是被各种“颠覆、革命”的技术裹挟,但最后技术一浪一浪过去了,出版还是出版,AI是下一个“革命者”吗?各种大公司、大平台如雨后春笋般出现,谁都说自己的技术最好用,又该如何做取舍?
刚刚过去的一个月,宛楠从一家互联网大厂离职,去了一个笃立要开拓出版行业AI业务的公司——蜜度科技股份有限公司——任出版业务部行业总经理。住在皇城根儿脚下的他,是典型的出版数字化见证者,从数字技术、产品、云服务到AI产品完整经历了一遍。他说,公司希望能在出版行业做深做透,他也愿意在出版业的数字化过程里更多贡献一份自己的力。
5月29日,“学习强国”学习平台在京举行的数字文化与数据服务融合发展战略合作签约仪式上,与蜜度签订了战略合作协议。双方将在将在产品研发、市场开拓和科技创新方面开展合作,释放数据价值,推动数智融合,赋能平台服务能力建设,为“学习+服务”理念的进一步探索和实践提供科技支撑。
于是,我和宛楠之间有了一次对话,关于AI,关于数字化,关于出版业。其实很多问题都没有明确的答案,但又似乎现状就是如此。
新技术最大的一个特点就是它不见得最后会形成产业。看上去很好,但是落地的时候找不到落地的点。但可能随着技术发展,过一段时间他可能还会再回来。
从传统出版业务的流程中来看,现阶段的AI技术更多是应用在提升效率的场景中,它是一种效率工作。AI能做的是维持内容的优先性不变,把内容发现的过程可能变得更加容易。
百道网:AI的概念比变脸的速度还快,大家都说AI多厉害,要颠覆各个行业。但是从现状来看,尤其从出版业的角度来看,一两年的时间过去了,并没有看到更多的产品落地。现在的AI发展到底到了什么阶段,到底厉害在哪里?
宛楠:各种AI的概念,都来自互联网信息产业。
AI这一块为什么最近这么火,是因为它的确在某些方向上,比如说语言处理、人机对话、文本写作、编辑审校等方面,它能够跟现在的一些场景和业务去融合,并且大家能够看到这个融合落地的希望。
百道网:所以其实从目前来讲,可能技术是领先于大家的生活和现阶段需求的,可能大家看到是一个趋势。可能有点像我们去看全球的时装秀,模特身上的各种五彩斑斓、奇形怪状,代表的是设计师的想象力和对未来趋势的理解。模特身上的时装并不是最终落地的衣服。
宛楠:对。模特身上时装设计、材料、风格上可能是这种趋势,有可能最后落到实际生活中,有可能会有一些变化,但其中某些元素会留下来,AI现在也是这样。为什么大语言模型这块最近这么火?因为它跟出版和内容创作相关。在内容创作和出版工作中的一些工作,可以用AI来进行辅助的。
例如,司法文书是有固定格式的。AI可以帮你先出初稿或者草稿,然后你再根据实际的内容去进行修改。这样就可以减少很多我们收集整理方面的工作,然后把写作的重心放到核心内容上去。另外比如内容的审校场景。很多厂商都做了审核校对产品,其中包括蜜度。它的价值在哪儿?就是你根据不同场景,在审读审稿、编辑加工批量处理、发排质检的时候,用AI的工具从不同的检查环节进行交叉检查。我们希望通过AI的技术手段,把这些非常繁琐的、效率比较低的一部分工作协助编辑做好,然后把更多的精力放到选题上,去提升图书的核心内容价值。
百道网:所以从传统出版业务的流程中来看,现阶段的AI技术更多是应用在提升效率的场景中,它是一种效率工作。对当前我们这个行业,大家可能更希望看到的是,AI能够带来哪些创新的场景?
宛楠:出版社最核心的资产实际上是内容。原来内容是印刷到纸张上的,很难被检索和发现。为此过去很多的工作比如书评、书摘、推广等,但效果其实并不是很理想。前两天我和一位出版社的负责人聊天也说起,要做智能服务,首先要把自己的知识内容变成智能。比如要把数字的内容做好智能标记、做成数据库。对于出版业,AI能做的是维持内容的优先性不变,把内容发现的过程可能变得更加容易。
现在大语言模型最常见的是对话式。当我问它一个问题的时候,不管是大众场景还是专业场景,AI所提供的服务内容可能都有所区别,但其实他们的技术原理是一样的。AI通过理解你的语义,指导你通过多轮的询问,最会把最适合的内容呈现出来。这个内容在传统的检索模式下,需要非常精准。比如搜宙斯,那么可能只有包含宙斯两个字的相关内容才会呈现。如果是要搜索一个标题,传统的检索方式也很难深入到全书内容中做相关性搜索。在大模型下,可以做到针对一个很小的颗粒度,具体深入到一本书、一个分类、一个库去定位目标对象的位置。
以前这种针对全书的搜索,通常只能局限在一个固定的版本里,功能自身不够智能。它不能够自我学习,不能更新。现在我们用AI来做这个事情,它可以通过训练,形成比如学科模型,然后不断有新内容添加进去,它就不用对这本书再重新学习,可以根据对这个知识体系的理解进一步对新添加的内容进行整理,并在用户提问的时候给出全面的回答。比如刚才我提的宙斯的例子,假如我上传了一本希腊神话的书进去,可能两分钟之后,我就可以针对宙斯提出所有的问题,比如宙斯有多少孩子,他们都是谁?这个问题可能在书里没有一句准确的话可以回答,但是大模型会根据自己的学习和分析,给出准确的答案。
2024年3月20日,法国市场监管机构宣布,已向美国谷歌公司开出2.5亿欧元罚单,原因是谷歌未经同意使用法国出版商和新闻机构的内容训练聊天机器人,违反欧洲联盟知识产权相关法规。
更多的出版机构还是希望先看到增长,再谈投入。所以最重要的还是观念的改变。
百道网:我理解你说的这个场景,其实是前面提到的叫内容智能化场景。我自己最直观的一个感受就是,包括这个内容的智能化场景,它是一个内容基础性建设项目,可能还是一个长期的工程,它需要时间。但是可能不管是出版社的社长,还是编辑,还是其他工作人员,这种智能化的基建,其实很难体会。大家希望看到的就是,你告诉我这个AI能给做出一个多炫的产品出来?比如今天想做个短片,明天想做一个美图,AI几秒钟就实现了,还非常完美。这个可能是短期大家最希望能够看到的东西。那么,在前端产品,AI到底能做一些什么?
宛楠:你说那些前端场景,AI可以比如说生成图片、生成视频。现在蜜度在和一些公司做新的项目探索,比如给书做插图设计,包括图书封面设计、内文插图,通过AI的设计提升装帧质量,目前来看效果还不错。
现在AI的文生图也取得了一些突破,比如可以从动画中截图一些图片保持内容的连贯性。但当前纯粹的文生图,还无法保障连贯性。比如一本《爱丽丝梦游仙境》,全书可能就需要几十张插图,而且每张图之间的故事跨度很大,AI就需要大量的人来做指导才能完成。但总体看来,也要比手工画图快得多。
百道网:具体到以你们的产品为例,目前哪些机构运用得比较好,他们在应用过程中,都取得了哪些效果?你们在和出版机构谈合作的时候,怎么能够说服他们采用自己的产品?
宛楠:蜜度目前最多的客户,其实来自各级政府机构,就像前面提到的,在公文写作这个场景下,AI的优势是比较明显的。在出版业,我们的智能审校目前属于行业前列。举例说,我们在描述一个产品的设计生产过程时,逻辑上是先设计再生产。在传统的审校体系里,只要这几个字、词没有错字,可能就没有问题。但智能审校系统会通过语义的判断发现文本逻辑的错误。
每个客户的需求可能都不太一样。我们在行业调研中也发现,每一个出版单位的工作方式和节奏都不同。在具体操作中,一些市场化水平比较高的机构,对新技术的接受程度也比较高。越是年轻的编辑,对技术前沿接触越多,对新技术的理解也就越深入。此外还有一个市场化竞争。比如教育出版机构大多对新技术跟得比较紧,他们在这上面的科研投入经费也比较足。更多的出版机构还是希望先看到增长,再谈投入。所以最重要的还是观念的改变。
百道网:可能这里边的难点,第一个是你刚才说的,人的这种思维、认知转变。第二个是出版社自己的战略方向、趋势走向。第三是不同的出版社它的内容的特点不一样,所以它对这个AI工具的需求不一样。反过来说,其实就是做AI技术这些互联网公司,他们希望用一个工具能够打通所有的东西。但可能真正落实到出版这个行业里边来,这个工具其实需要做更多的这种细化和专业性的分工。
宛楠:现有通用大模型的商用程度,真正能够去落地的比例不是很大。不管按学科也好,按行业也好,最终肯定是要做到一个比较窄、垂直的方向上来。实际上出版行业它是一个横向的行业,它里面包含了各个行业的知识内容,这些内容就需要各个行业去落地,出版只是某一个行业落地过程中的一部分。我们在这个行业中可能是做知识服务、知识传播的。所以将来这个模型的应用中,出版行业也可能会出现在设计、生产、制造、传播中。AI可能会在各个行业中都有一个交叉的点,并发挥自己的作用。
AI产品具体到出版业,可能很难用经济效益来衡量,但可以从社会效益的角度来衡量这个投入产出比。
真正出好书还是要靠编辑,我们能做的是把编辑从繁杂的、琐碎的过程中解放出来,去从事更有创造力的工作。
我们现在就是想让AI达到一个学科中上的能力和水平,那么它对我们的编辑这个场景使用场景来讲,知识储备就够用了。
AI能够缩短一个编辑从传统的纸书出版向融合编辑思维和能力的一个转型时间。那AI是不是也能够缩短出版社从传统出版向融合出版转型的时间?
百道网:回到刚才说的一个问题。出版业很穷,挣钱不容易。所以对社长们来讲,去投一个新东西的时候,第一反应就是能不能挣钱,也就是投资回报率。那现在AI来了,大模型来了,然后蜜度的产品来了,投入产出比怎么样来衡量?
宛楠:现有的AI产品,大多都集中在产品的后端。具体到出版业,我们更多的是集中在内容生产端。
如果从社会效益的角度来衡量这个产出比。现在编辑入门的要求越来越高,要懂策划、懂市场、懂新媒体……但是可能大家踏踏实实下来练基本功的机会反而没有以前那么多。这几年出版圈出了不少内容审校质量上的问题。所以我们现在可能更多的切入口还是提升图书质量,能够提高出版效率,把差错控制在合格甚至优良范围内,节约大量时间和成本。除了在内容质量上可以提供一些帮助,AI在发行端也有助力。比如产品发行出去之后,可以利用AI来做市场分析、搜集市场数据、汇总市场热点、整理市场反馈,这些数据都可以更有效地帮助编辑发现好的选题。当然,这可能更多是一个充分条件,不是必要条件。真正出好书还是要靠编辑,我们能做的是把编辑从繁杂的、琐碎的过程中解放出来,去从事更有创造力的工作。
百道网:上次在昆明参加全民阅读大会。一个论坛上主持人问我,新质生产力时代生产力,出版社编辑们来讲,核心的问题是什么?我当时说,其实是时间。第一是现在这个技术迭代的时间非常快,就是出版社是不是能够适应这种迭代的节奏和速度。第二是出版社的上级单位给出版社的时间是多少,然后出版社的社长给编辑们的时间是多少。你刚才提到的内容智能化、知识服务或者智能审校,具体的出版社单位都需要有一个量化的指标。你说通过AI来提高图书质量,那现在有没有一些这种可以量化的指标来证明它确实达到了你说的这个效果?
宛楠:这个我们公司内部是有评测过的。传统的审校系统有一个功能,比如查询、误报等,我们也是在同样的案例和功能上来做对比。包括我们的很多技术人员也是从传统审校业务中转型过来的。后来我们在传统审校系统已有的思路上加了概率的算法,现在在智能审校的模型上,是可以真正去学习的,不断成长。系统阅读的书越多,学的东西越多,就像一个人的成长过程,学无止境、上不封顶。我们现在想让AI达到一个学科中上的能力和水平,那么它对我们的编辑这个场景使用场景来讲,知识储备就够用了。
百道网:然后咱们回到我刚才说的那个时间的问题。2022年初,我采访了一位出版集团的负责人。他说,融合出版是出版的未来,但是一项长期的工程,可能需要给年轻一辈的编辑至少十年的时间,才能成长起来。但以现在AI技术的发展速度看,留给编辑们的成长时间可能没有那么多了。
宛楠:AI可以帮助编辑们缩短这个时间。原来我刚入出版社的时候,我的导师跟我说过一句话,这板凳上要坐十年,不然你做不到独当一面。但是现在如果给每一个编辑能够配上一个学科能够达到一个中上水平的这样一个人在你身边,开始的时候他可能能当你的老师,后面他可以当你的助理,那么这个我觉得可以大大加快编辑的成长速度,提升编辑的专业学习能力。
百道网:从编辑的角度,AI能够缩短一个编辑从传统的纸书出版向融合编辑思维和能力的一个转型时间。那AI是不是也能够缩短出版社从传统出版向融合出版转型的时间?
宛楠:技术上是可能的,但是这个理念上的转变可能会需要一个过程。出版社可以把AI当成一个能辅助行业成长的工具。
生产力是为社会生产来服务的。对于行业来讲,新技术不断出现是一个好事儿。技术一直在提升,我们才有进步的空间。
出版社必须先躬身入局,只有自己实际用上了AI产品,才有可能发现其中的好与不好。
行业人士自己可以对AI进行规划,把想让他帮你干什么这件事情弄清楚。然后在技术实现、模型训练上和技术公司一起打磨。
出版社内部至少需要一个类似“产品经理”的角色。他可以不用自己去写代码,但能够提出产品设想和建议,比如需要开展什么业务,需要什么功能,并把这些具体的需求计划提交给工程师团队。
百道网:AI对出版社来讲它是一个效率的工具,但是AI迭代的速度太快了。比如现在的大模型,版本进化非常快,可能过了一段时间,一个新的东西又出来了。出版社可能前一个的节奏还没有跟上的时候,后边又来了一个,这个时间差其实对出版社是非常的不利的。出版社总是在不断的适应和追赶。你觉得这个问题应该怎么解决?
宛楠:这个其实可能不光对于出版行业,对于每个行业来讲,都存在这个问题。生产力是为什么?生产力是为社会生产来服务的。对于行业来讲,新技术不断出现是一个好事儿。技术一直在提升,我们才有进步的空间。
对于出版行业来讲,一定要想好自己要做什么,这个行业到底给社会提供的价值是什么?产品模式可以更新,生产工具可以更新,但是行业存在的价值和能起到的作用,不会因为产品模式和生产工具的更新而变化。
百道网:现在AI的工具很多,AI产品也很多。对出版社来讲,行业自己的一个特点。拥抱AI其实是需要一个合适的切入口,你觉得最合适的一个切入口是什么?这个切入口的投入产出是最好的,对行业发展是最有利的这个切入口在哪儿?
宛楠:AI是一个“工具”。出版行业的主要内容是文字,AI在文字处理上已经相对成熟。从我对行业的理解来讲,有三个方面可以切入:一是从内容创作端,为作者提供文本的润色和资料搜集工作,甚至可以帮助提炼大纲、人物角色等等。这个场景下,AI是一个辅助工具和策略工具。二是在出版的核心编辑环节,AI可以作为编辑助手。三是在发行营销环节,AI可以作为数据统计和分析的角色切入。现在的新媒体短视频平台,都是靠数据、算法在推送,千人千面的算法面前,数据的关联性很强。依靠传统的统计方式已经远远不能满足需求。所以可以在运营上把AI加进去。
总体来说,出版社必须先躬身入局,只有自己实际用上了AI产品,才有可能发现其中的好与不好。
百道网:出版业都是文字高手,相对距离技术较远,绝大部分人对技术其实都只是一知半解。现在有两种说法,第一出版社需要自己去做一个技术团队吗?第二是通过跟外部的这种技术合作,来达成目标是否长期可行。这二者可能有不同的选择,可能会达成不同的结果。
宛楠:自己来组建技术团队和训练行业模型的投入成本很高。很多模型的训练,对算力的要求是非常大的。而且出版机构自己的内容基本都限于自身的内容,可能仅仅是实际需求的一小部分,最好是利用目前已有的产品。
AI为什么这么火?是因为它实际上对于用户的技术门槛要求比较低。行业人士自己可以对AI进行规划,把想让他帮你干什么这件事情弄清楚。然后在技术实现、模型训练上和技术公司一起打磨。
百道网:这两年,直播电商火了,短视频火了。出版社于是纷纷组建自己的直播团队、自播团队,有专门的人负责这块业务。那可能对于AI也是一样的,外面有技术团队做服务,内部也是需要有人来对接。原来的那些文字编辑,其实他们是干不了这个活的。对于出版社人才的配置有什么建议?
宛楠:其实我们一直在说数字复合型人才。简单点说就是这个人要懂出版业务,同时对前沿技术有一定的了解。在出版社内部至少需要一个类似“产品经理”的角色。他可以不用自己去写代码,但能够提出产品设想和建议,比如需要开展什么业务,需要什么功能,并把这些具体的需求计划提交给工程师团队。他能够把这些事情说明白,并协助完成产品的初步构想,就足够了。当然,这个人数不是绝对的,也和出版社自身在数字化业务上的规模和预期有关系。
百道网:前面你们提到蜜度的客户更多是一些机构客户,是什么原因促使你们要加大在出版行业的布局?你们预计这块业务的市场规模有多大?
宛楠:蜜度的产品在公文、文书校对中已经做得很好,口碑也很不错。有人就问,校对这个业务最早是从哪个行业出来的?我们回头再一看,既然校对本身都是从出版业开始的,那我们在出版业如果做不好,是不是有点舍本逐末了?从技术的角度看,我们的产品也必须回归到更多的内容服务和训练上来,出版是一个避不开的行业。不管是技术的提升与挑战,还是产品的迭代和完善,出版都是要做的。
传统的校对业务仅仅是文字内容,在新媒体快速崛起的背景下,图文、音频、视频,都成了新的服务对象,应用场景成倍地扩张,市场规模也会迅速扩张。
发表评论前,请先[点此登录]