文 章

馆藏严选|人民邮电出版社推荐《深度学习》——写给开发、研究和工程人员的“深度学习”教科书

作者:朱海波   2017年07月23日   来源:百道网

(点击图片 进入论坛)

【馆藏严选】深度学习的概念由Hinton等人于2006年提出,如今有10年之久,在这期间“深度学习”得到了巨大的发展,成为了风靡全球的人工智能新技术。它使人工智能产生了革命性的技术突破,它正在告诉我们,人工智能时代离我们不远了。《深度学习》英文版《Deep Learning》由在深度学习领域的顶级专家Goodfellow, Bengio 和 Courville共同撰写。《深度学习》中文简体版已于7月22日杭州的人工智能大会上进行新书首发。它的出版表明,我们进入了一个系统化理解和组织深度学习框架的新时代。本书的简体中文翻译版得到了众多华人科学家的鼎力推荐。而作为出版这本书的人民邮电出版社十分看重这本书,是该社的重点推荐图书。近日百道网也就此书的前后出版过程,采访了人民邮电出版社信息技术第一分社的高级策划编辑王峰松。

遇见

人工智能时代的到来

“深度学习”这个术语于2006年被提出,在十年间不断发展,渐渐成为领域内的热门,成为风靡全球的人工智能新技术。如今在诸如计算机视觉、语音和音频处理、自然语言处理、机器人技术、生物信息学和化学、电子游戏、搜索引擎、网络广告和金融等领域内,“深度学习”正发挥着作用。这说明人工智能已经走入了人们的生活,不再是科幻电影中的一幕。随之,国内外各大互联网巨头纷纷布局人工智能技术,以及产业界各种人工智能大会频繁召开,这些都告诉我们人工智能时代正向我们走来。

然而“深度学习”火热发展的同时,却没有太完善的理论方面的专著。本书英文原版的三位作者是“深度学习”领域中的顶级专家,他们分别是Ian Goodfellow、Yoshua Bengio和Aaron Courville。有趣的是,这三位恰好是老、中、青三代专家的结合。出版方告诉我们,Yoshua Bengio是“深度学习”领域的奠基人;Ian Goodfellow以提出GAN(生成式对抗网络)而闻名,是“深度学习”领域近年涌现的新星;而Aaron Courville则是处于研究生涯中期的领域中坚。所以本书在行文和结构中很好地考虑到了处于研究生涯各个不同阶段的学生和研究人员的需求,可以说从这个角度看,此书是一本非常好的关于“深度学习”的教科书。正如王峰松对本书的评价:“这是一本还在写作阶段就被开发、研究和工程人员极大关注的‘深度学习’教科书。”

同样一本书,新智元创始人兼CEO杨静评价说“这是一本教科书,又不只是一本教科书。任何对‘深度学习’感兴趣的读者,本书在很长一段时间里,都将是你能获得的最全面系统的资料,以及思考并真正推进深度学习产业应用、构建智能化社会框架的绝佳理论起点。”无疑,这个评价是非常正确的,如果想要深入全面的了解“深度学习”,这本书是最佳选择。《深度学习》从浅入深介绍了基础数学知识、机器学习经验以及现阶段深度学习的理论和发展,它的出版表明,我们进入了一个系统化理解和组织深度学习框架的新时代。

积跬步致千里

此次人民邮电出版社能够获得出版这样一个重量级图书机会,看似偶然,实则是社里多年来出版经验的积累,编辑们对出版市场的敏感,以及人民邮电出版社信息技术第一分社精耕细作的结果。王峰松说:“这个结果的取得,和人民邮电出版社信息技术第一分社多年来在外版书上的持续经营、深耕细作是分不开的。在国际版权贸易这个生态链条上,信息技术第一分社多年来积累的口碑、人脉起到了关键作用。”原来在三年前2014年的5月,与社里长期合作的一位译者,告诉编辑一个信息,“深度学习”界的泰斗Yoshua Bengio要出书了!果然他们在加拿大蒙特利尔大学网站作者的个人网页上看到,“深度学习”领域的第一本书赫然在目。

在三年前,国内“机器学习”热、“深度学习”热尚处于萌芽状态。除了专业媒体上一些零星的报道之外,一般大众甚至都还未曾听说过这个术语。但作为策划编辑,特别是策划IT技术图书的编辑,对技术的发展态势应具有足够的敏感性。当时“深度学习”是这样一种情况,它是当时国外最火的机器学习技术之一,主要用来处理大数据,国内外的互联网巨头像Google、Facebook和百度都在研发这种技术,而且取得了不错的效果。社里的编辑在看到作者写的一个草稿(draft)后,内部及时进行沟通,分析未来市场。“我们内部沟通后,凭借我们多年做外版书的经验,隐约感觉到这本书将是一本大书,事后的发展也证明了这一点,但还是大大超出了我们的预期,因为谁也没有预料到深度学习在AlphaGo之后能火遍全球、火遍各个行业”,王峰松对我们说。

之后,他们第一时间联系作者,MIT出版社(英文原书的出版方)的版权部。经过交流,得知要待原书确定了出版日期之后才能正式签署合同。之后就是漫长的等待,差不多经过一年多的时间,2015年10月19日这天,分社负责版权合作的同事给社里送来了好消息,国外的合同已通过航空挂号信正式寄出,搞定了!至此,尘埃落定,人民邮电出版社获得了本书中文简体版的版权。

磨合

谈到具体的出版图书环节,王峰松说:“一本书从最初的选题策划到最后的印刷出版,中间要经历诸多环节。读者看到的一本书是成品,关心的是内容好坏、版式设计是否漂亮等,但是对于一本书背后的故事就不一定了解了,就像怀孕生子,个中辛苦,只有做母亲的自己最清楚了;一本书碰到的沟沟坎坎儿,也只有编辑最明白了。”

开源翻译:敢为天下先

作为引进的一本英文信息技术领域的图书,遇到的第一个问题就是翻译。《深度学习》作为一本如此知名的重头图书,激起了很多专家学者和技术爱好者的翻译热情,并积极与社方联系。王峰松告诉我们,大约在2016年7月,他们经过反复遴选,对比不同译者的试译稿件,评估技术水平和翻译能力,最后确定由北京大学张志华教授带领的团队负责翻译。

确定翻译团队后,因为当时英文原书还未上市,为了将这本好书第一时间出版,社里和译者沟通后,做了大胆的决定:立即启动翻译工作,从作者在互联网上公开的图书初稿入手,待正式的纸书出版后,再比对内容存在的差异进行更新。应该说这一策略的制定和实施,才保证了简体中文版的快速推出。

2016年11月,社里拿到了英文纸书的电子文件,同期,英文纸书在美国亚马逊网站上开始预售,一经上架就位居人工智能类新书榜第一。王峰松说,此刻,这本书的强大影响了已经初现端倪。并且有很多人通过各种渠道找到他们,表示希望翻译此书。

2016年12月,英文纸书正式出版。也是在这个月,简体中文翻译版的初稿被译者团队放到了Github上首次公开。随后引发了各大媒体、论坛的疯狂转载,微博、微信上凡是推荐机器学习必读书目的,必定有这本书,也必定会附上初稿的下载链接。这种情况引发了社里编辑对对图书版权问题的担忧。

在这个问题上,社里同译者有了小小的分歧。译者有他们自己的考虑,他们提出了一个新的概念“开源翻译”。他们认为:把初稿在互联网上公开,可以集众人之力完善书稿的翻译质量,同时电子档比纸书更便于携带、查阅,方便大家学习。译者相信,英文原书类似的做法说明了,在如今知识有价的时代,先阅读后付费的模式完全行得通。他们将这种做法称为“开源翻译”。

接下来发生的事,让社里迅速做出了要“官方开源”的决定。这件事是Github上出现了一支由机器学习爱好者组成的开源翻译团队浮出水面,出于学习和研究之目的,在未获MIT出版社和作者授权的情况下已经翻译了4章,并将内容在互联网上公开发表。社里认为:官方翻译版本的开源,能起到正本清源、亮明正身、最大限度地共享知识的作用,利大于弊。同时,和译者沟通后形成共识:初稿之后的一切修改、完善,均不在互联网上公开,以体现纸书的价值,尊重出版社和作者的版权。另外,对自发翻译的爱好者,社里也邀请他们参与到对官方翻译版本的贡献当中来。

至此,开源翻译的创新尝试,在出版社、译者、爱好者的对话交流之后,应该说达到了令各方都基本满意的效果。经过3个月的网上公开征集意见,2017年3月15日,译者的正式译稿交付出版社,进入出版社的审校流程。

Latex排版:让人又爱又恨

此次对《深度学习》的出版,编辑们竟然在他们最熟练的排版遇到了难题,这个让人又爱又恨的难题就是Latex排版。

在书稿的日常排版中,编辑最经常接触到的排版软件有两类:Microsoft的Word和Adobe的Indesign。黑白印刷的书,通常用Word来排;彩色印刷的书,则常用Indesign。对这两类排版软件碰到的“疑难杂症”,做了多年编辑的人驾轻就熟。但是《深度学习》这本书,与众不同,采用了比较少见的Latex排版。熟悉Latex的人知道,在国际学术期刊发表论文通常采用Latex软件排版,经Latex排版的数学公式比其他软件漂亮。《深度学习》英文原书采用Latex排版,译者在翻译的过程中,为了最大限度地忠实原著,不只是内容的翻译,还包括版式样式上,因此也采用了Latex。与Word、Indesign不同,Latex是命令式的排版软件,版式的任何设定都要通过排版命令来实现,由于不是“所见所得”,需要编译生成PDF后才能看到编辑们熟悉的页面。这也导致了会Latex排版的人不多,用Latex排书稿效率较低、速度较慢。

而之后不断地修改和完善更加给编辑们出了难题。译稿在交付出版社之后,译者对译稿的修改和完善并没有止步。王峰松说:“当然,译者是本着精益求精、对图书质量负责的态度在做这件事,但客观上给出版流程增加了一点复杂度。”比如,5月15日,书稿一审完毕之后,译者发来了第1次修订。6月15日,书稿已经发排的情况下,译者发来了第2次修订。特别是第2次修订,译者对书末的参考文献进行了调整,导致正文中对文献的引用多处出现变动。当然,最后经过编辑与译者、排版人员的反复沟通,终于找到了解决方案。通过排版人员的细心比对,也保证了编辑们的排版文件与译者的修订同步。

“编辑”把控,与时间赛跑

王峰松告诉我们,在出版社的内部流程中,作为一本书的责任编辑,很重要的一个角色就是流程管理、进度把控。越是重点书,越是有时间要求。如何在有限的时间内,保证质量的前提下,把重点书及时赶出来,也是编辑力的一种体现。

《深度学习》这本书在时间上就对编辑们提出了非常高的要求。从简体中文版由人民邮电出版社独家出版的消息扩散出去之后,就不断有人来问书什么时候能出版,可见此书的关注度之高,读者非常期待尽快上市。在这种情况下,如果按照一般书的流程,从一审、二审、三审、申领书号、一校、二校、三校、印刷、入库这种串行的方式来走,将非常耗费时间。于是,出版社根据以往经验,把一些环节由串行变并行,同时并举,以有效缩短时间。同时,把校对的环节,利用周末加急处理,不占用工作日,赢得更多的时间,以处理其他必须在工作日解决的事务。

2017年7月22日,《深度学习》新书发布会在杭州的人工智能大会上顺利举行。为此,社里曾制定了详细的时间表,在各个环节上采取“盯人”战术,请社内各环节的人配合,以保证各环节按计划推进,最终保证了新书准时上市。

成书

人民邮电出版社在零售图书市场上多年的打拼,锻炼了一支高效的书稿加工、校对、印制队伍,他们对像《深度学习》这样的重点产品的出版过程,提供了重要的保障。王峰松说:“本书面世之后,读者们将看到的是一本结构严谨,且互动、实用,制作精美的图书。”

结构严谨

本书文前有3页数学符号的约定,对全书使用的数和数组、集合和图、线性代数中的操作、微积分、概率和信息论、函数以及数据集和分布的符号做了详尽的说明。书末提供近50页的参考文献。正文中对主要的技术术语加黑显示,并在书末提供术语索引。

互动、实用

英文原书提供了配套网站:www.deeplearningbook.org。该网站提供本书的各种补充材料,包括练习、讲义幻灯片、错误更正以及其他对读者和讲师有用的资源。简体中文翻译版的配套服务由人民邮电出版社的异步社区www.epubit.com.cn提供,读者可以在社区里提交勘误,并有机会与译者直接沟通交流。

为了服务各类读者,本书组织为3个部分,第1部分是数学基础和机器学习的基本概念,第2部分介绍成熟的深度学习算法,第3部分探讨深度学习未来的发展方向。读者可以随意跳过不感兴趣或与自己背景不相关的部分。比如,熟悉线性代数、概率等数学知识的学生,可以跳过第1部分;关注技术实现、系统实现的软件工程师,则可以重点阅读第2部分。

为了帮助读者选择阅读的章节,作者还特别绘制了一张本书的内容组织结构图,说明了各章内容之间的相互关系和阅读的先后顺序。

制作精美

《深度学习》的封面采用了艺术家Daniel Ambrosi提供的中央公园杜鹃花步道梦幻景观。该图片是在艺术家的亿级像素全景图上,应用Joseph Smarr(就职于Google)和Chirs Lamb(就职于NVIDIA)修改后的Google DeepDream开源程序,创造了亦真亦幻、艳丽夺目的梦幻景观。封面图的细节很多,包括花的细节、树枝的细节,枝枝杈杈的,表达的就是深度学习的“深度”、不断迭代的意思。

王峰松介绍说:“《深度学习》无论是其英文版还是中文简体版都得到了各方科学家,研究专家、教授的鼎力推荐。英文原版得到了Google杰出的研究科学家Geoffrey Hinton老先生,OpenAI联合主席、特斯拉和SpaceX共同创始人兼首席执行官Elon Musk,以及Facebook AI研究院院长、纽约大学数据科学与神经科学教授Yann LeCun的大力推荐。简体中文翻译版则得到了众多华人科学家的鼎力推荐,包括微软研究院首席研究员华刚博士,亚马逊主任科学家、Apache MXNet发起人之一李沐,腾讯优图杰出科学家、香港中文大学教授贾佳亚,ResNet作者之一、Face++首席科学家孙剑,香港中文大学信息工程系主任汤晓鸥教授,以及华为诺亚方舟实验室主任、北京大学和南京大学客座教授、IEEE Fellow李航。”

如此细致入微的编校过程,加上众多专业人士的权威推荐,正如王峰松所说,在这个“系统化理解和组织深度学习框架的新时代”,希望这本书“能帮助人工智能技术爱好者和从业人员在三位专家学者的思维带领下对‘深度学习’实现全方位的了解”。

(本文编辑:June)

作者:朱海波

来源:百道网

(点击图片 进入论坛)

加编辑群提问

百道学习

随时随地 百道学习

百道学习

点击图片 查看详情

百道学习

点击图片 查看详情

相关文章

发表评论前,请先