文 章

陈昕:人工智能与出版业的数字化转型

作者:陈昕   2020年07月22日   来源:百道网

(点击图片 进入论坛)

【百道编按】自从1956年在达特茅斯学院召开的人工智能夏季研讨会掀起第一波人工智能浪朝至今,人工智能已经走过了六十多年的历程。21世纪以来人工智能飞速发展,而如今,人类已经迈进人工智能的新时代。本文作者陈昕先生,以一个出版人的视角,深入探讨人工智能给出版行业带来的挑战和机遇,一语道破出版人对人工智能的注意力不应仅仅集中在数字出版流程的再造上,也不应该局限于各种新兴技术对人工智能的赋能上,而要真正认识到人工智能的本质在于知识信息的处理以及建设专家系统和知识库,从而真正推进出版业的数字化转型。


一般说来,技术主题的图书生命周期都不会太长,十年二十年就会被替代,除非是那些思想辉光灼人的著作,才会有耐久阅读的价值,就像沉缸许久的佳酿。格致出版社新近重版的图灵奖得主爱德华•A•费吉鲍姆和专栏作家帕梅拉•麦考黛克于近四十年前合作撰写的《第五代:人工智能与日本计算机对世界的挑战》,就是这样一部思想火焰不息的著作,有着重要的阅读和反思价值。

《第五代:人工智能与日本计算机对世界的挑战》
点击图书封面可在三大网店购买
出版社:格致出版社
作者:[美] 爱德华·A. 费吉鲍姆 帕梅拉·麦考黛克
译者:汪致远 童振华 江绵恒 江敏
出版时间:2020年06月

自从1956年在美国新罕布什尔州汉诺佛小镇达特茅斯学院召开的人工智能夏季研讨会掀起第一波人工智能浪潮至今,人工智能已经走过了六十多年的历程,其中有过几波高潮,也曾长时期地陷入低潮。进入21世纪后,伴随着机器人、移动互联网、大数据、超级计算、神经网络、传感网等理论和技术的发展与成熟,人工智能开始加速发展。2016年“阿尔法狗”击败李世石,机器人对人类围棋冠军的首次胜利迅速掀起了新的人工智能浪潮。以深度学习为引领的人工智能应用,在计算机视觉、语音识别、自然语言处理、人工神经网络等领域取得突破性进展,从而人工智能渗入社会每个细胞。从政府到研究机构,从企业到个人,人们对于人工智能的热情再度激发,热烈地拥抱人工智能技术。仔细地分析当下人工智能的最新进展,发现不少在费吉鲍姆和麦考黛克这本近四十年前出版的图书中已有预言或提及。

这本图书的主旨在于介绍第五代计算机,即具有人工智能的计算机。在这之前计算机已经发展过四代,那就是四五十年代的电子管计算机,五六十年代的晶体管计算机,六七十年代的集成电路计算机,七八十年代的超大规模集成电路计算机。第五代计算机最先是由日本在1981年提出并加以规划和进行项目实施的,所以费吉鲍姆和麦考黛克在书名中直接了当地点明这是日本计算机对世界的挑战。令人遗憾的是,日本的这个项目并没有成功,十年后渐渐偃旗息鼓,至今在人工智能领域还大大落后于美国,这其中有太多值得总结的东西。比如,如何看待科技进步、工业发展过程中的市场作用和政府作用,如何看待学习模仿和自主创新,如何看待国家间的产业竞争和合作,等等。当然,这本近四十年前出版的图书不太可能涉及一个当年刚刚开始的五代机项目的未来成败及原因分析,但费吉鲍姆和麦考黛克在过了差不多四十年后的今天为此书中文版所写的序言中仅对日本五代机项目的失败作了些技术层面的总结,而对深层次的原因则语焉不详,未免让人好不过瘾。不过,当年他们在这本书中详细介绍了日本政府欲以8.5亿美元巨额预算开发第五代计算机系统的过程,以及日本为五代机项目特别设立的“新一代计算机研究所”(TCOT)的运行情况,这为我们今天总结这段人工智能发展史上具有重要节点意义的历史提供了基本的材料。

这本图书介绍了第五代计算机的核心价值和技术,重点讨论了“专家系统”的设计和理论,研究了五代机一旦开发成功将对人类社会产生什么样的影响,以及各国在当时作出的种种应对,还附有实验性的与付诸使用的“专家系统”选录和五代机研究开发论题。这本书既谈技术又谈战略,既谈经济也谈政治,而战略眼光的敏锐和超前是其经久不衰生命力的基石。

斗转星移,人类已经迈进人工智能的新时代,这本图书在许多方面都给读者带来启示,引发人们思考人工智能在未来对世界带来的各种各样的挑战和机遇。对出版人的启示是,一方面我们应该清楚,在信息化、数字化、人工智能的时代,掌握知识内容的重要性,这是出版企业赖于生存的根本;但这些内容应该是系统的成体系的,这就要求我们把主要的精力放在知识的选择、整理和提升上。另一方面,我们在建设和提供成体系的知识内容时,还必须要有知识工程的理念,学会运用知识表达、知识利用、知识获得的人工智能技术来整合和发掘内容,这样才有可能通过机器的“深度学习”产生“习得知识”,满足读者生生不息的潜在需求,扩展出版业的发展空间,进而完成传统出版向現代出版的转型。

这本图书对出版业的意义还在于,不仅告诉了我们人工智能的基本理论和核心技术,还向我们提供了建设知识库的方法和路径,其中最重要的是“专家系统”的理论和技术,费吉鲍姆就是因为在这个方面的贡献而获图灵奖并被称为“专家系统之父”的。“专家系统”在上一波人工智能研发高潮中处于主要的位置,它是第五代计算机的核心,在新一波高潮中由于新技术的赋能仍然发挥着重要的作用。

本书用一章的篇幅,详尽地介绍了“专家系统”。它是一个在某一专门领域或方面已被赋予知识和才能的计算机程序,一个达到或超过专家水准的专门知识系统,一个人类专家的具有高水平智能的助手。它包括人机接口、推理和知识库管理三个子系统。专家系统主要是依靠许多知识来发挥功能的,因此众多的专家系统按照一定的结构集合在一起,便形成了“知识库”,用来存储事实、假设、信念和探试,以及专业知识等,并处理数据库以达到诸如诊断、解释或解决问题等预期目标。而设计和建造专家系统及知识库程序的技术就是“知识工程”。书中还介绍了专家系统已经应用的领域,剖析了若干专家系统建构的案例,包括场景、框架和推理,叙述了运用计算机来描述知识,利用知识来创造出推理程序,进而将挖掘出的知识精华编成知识库的过程,从而把知识表达、利用和获得的框架和程序展示给我们,这对出版业如何建构各类专业知识库具有重要的借鉴意义。这些年来,我国出版业建设专业知识库的呼声不绝于耳,但对如何建构却知之甚少,一碰到具体问题便束手无策,以至到今天,除了建构个别语言工具类的知识库外,其他方面建库的尝试还很少进行。人工智能在当下,专家系统的重要性更加凸显,“阿尔法狗”告诉我们,依托于专家系统,计算机也可以通过“深度学习”来产生并获得知识,这意味着知识的主体已经不仅仅是人,也可以是机器。这对出版业未来的发展提供了新的思路,也是全新的挑战。问题在于出版人是否认识到这一点,是否准备迎接挑战。

2007年我在考察美国数字出版归来后,曾撰写长文讨论数字出版的商业模式。在那篇文章中,我把全球出版业业已开展的数字出版的商业模式分为三类。(1)网络营销:利用网络和数据库推动传统出版的发展,实现纸质图书市场的扩容,达到业绩提升、服务改进、顾客满意度提高的目的。在这里网络是作为传统出版营销升级的工具。(2)网络运营:主要在网络平台上生产经营内容资源,创造出新的成本—营收模式,实现运营的最优化、效益的最大化,并形成可持续赢利的商业模式。在这里网络是作为内容产业的生产经营平台。(3)网络营销+网络运营:网络既作为传统出版营销升级的工具,也作为内容产业的生产经营平台。

十多年过去了,我们看到西方主要发达国家出版业在这三类商业模式的运营上都取得了长足的进步。尤其是在网络运营上,科学、技术、医学和学术类的专业出版企业通过建立超大规模的专业数据库和全新的在线平台,很大程度上满足了专业机构和专业人员的个性化需求,创造了很好的业绩,以至这部分营收已经占到其全部营收的大部分。对他们而言,树立人工智能的理念,运用人工智能的技术,进一步加强和完善专家系统和知识库的建设,建立强大的知识工程,以达到通过“机器的深度学习产生习得知识”的状态,可能是下一步需要重点解决的问题。对我们而言,这些年来基本上是在网络营销的层面兜圈圈,最近两年又热衷于开展“抖音”之类短视频APP的营销(这当然也是应该做的事),而在网络运营的层面则左右摇摆,举棋不定,很少有出版企业在专业知识库上下功夫的,更惶论运用人工智能的理念和技术来提升知识信息处理能力,拓展出版业发展的新的空间了。这可能也与我们对人工智能的认识不足有关。业内不少人士对人工智能的注意力仅仅集中在数字出版流程的再造上,由“编、审、校、印、发”等环节的机械数字化转向协同一体的智能数字化,兴趣也限于各种新兴技术对人工智能的赋能上,而对人工智能的本质在于知识信息的处理以及建设专家系统和知识库的意义则不甚了了,理解不够,这样的一种状态是难以真正推进出版业的数字化转型的。正因为如此,我郑重地推荐出版业人士都来读一读费吉鲍姆和麦考黛克的这本超级“长命”的图书。

 

(本文编辑:杨婧)


作者:陈昕

来源:百道网

(点击图片 进入论坛)

加编辑群提问

百道学习

随时随地 百道学习

百道学习

点击图片 查看详情

百道学习

点击图片 查看详情

相关文章

发表评论前,请先