文 章

新书推荐|《看见:从生物视觉到计算机视觉》

2025年12月08日 百道网

(点击图片 进入论坛)

计算机视觉与生物视觉在原理上有诸多相同或相似之处。计算机视觉的发展离不开生物视觉研究带来的启发,而计算机视觉应用也给生物视觉特别是眼视光医学领域带来了新方法和新工具,两者相辅相成,关联紧密。通过《看见:从生物视觉到计算机视觉》一书,读者能了解生物视觉和计算机视觉的基本原理知识,认识人工智能在视觉领域的典型应用和发展前景,洞悉高速发展的计算机视觉技术背后的逻辑。

虽然基于计算机视觉技术的软件或设备已经得到广泛应用,但市场上针对计算机视觉原理的科普作品并不多。目前,有关计算机视觉的图书多数为专业教材,重点落在算法设计与工程实践上,内容难度较高。少数普及性读物则把重点放在介绍计算机视觉的特点及具体应用上,只求让读者形成感性认识,并不触及核心概念和原理。《看见:从生物视觉到计算机视觉》一书关注有志于从事跨领域工作的医学和IT工作者的迫切需求,促进学科间的交流与合作、推动技术创新,对提升相关从业人员的整体创新能力具有重要意义。

《看见——从生物视觉到计算机视觉》
点击图书封面可直接购买
出版社:上海科技教育出版社
作者:倪冰冰 柯碧莲 著
出版时间:2025年08月

内容简介:

本书是一本探究视觉系统的本质,揭示计算机视觉与生物视觉之间紧密关联的原创普及性读物。

作为人工智能领域研究最为活跃、应用最为广泛的分支之一,计算机视觉的发展离不开生物视觉研究带来的启发。本书对生物视觉与计算机视觉的原理知识做了深入浅出的介绍,通过两者的对照,揭示生物/计算机何以“看”(感知),怎样“见”(理解),说明当下流行的“图像识别”“文生图”等人工智能应用是如何模拟生物视觉系统进行算法与架构设计的,探讨人们对视觉系统的认识给计算机科学和眼视光医学带来的的深远影响。

作者简介:

倪冰冰,上海交通大学电子工程系教授,博士生导师。主要研究方向为计算机视觉、多媒体内容生成,是国内最早开展生成式人工智能(AIGC)研究的学者之一。所领导的科研团队长期聚焦面向高可控的生成式人工智能研究,在图形图像/三维模型的参数化代理表征理论、面向编辑的生成式计算架构,以及基于多源异构眼部数据建模辅助诊疗等方面取得了一系列原创性成果。

柯碧莲,主任医师,博士生导师,上海交通大学医学院附属仁济医院眼科主任、教研室主任。担任中华医学会眼科学会视光学组委员,中国女医师协会视光专委会副主任委员等。从事眼科医、教、研工作30余年,致力于近视防控及手术、沉浸式可穿戴设备辅助视功能重建、多模态影像预测近视进展,以及实验性近视机制的研究,发表论文百余篇,其中SCI收录50余篇,主持国自然基金项目4项。领衔完成有关青少年近视临床调控项目,获上海市医学科学奖。

精彩书摘:

眼睛是自然界进化的奇迹,视觉是人类认识世界的“首要”信息源。千百年来,人类始终在孜孜不倦地探索着视觉系统构造与功能的奥秘:“来自四面八方的光线总是不偏不倚地聚焦在视网膜上”“人眼拥有很少的颜色感知细胞,然而对颜色的差异又如此敏感”“人们总能有选择地关注视野中某些重要的区域和关键的特征而忽略不太相关的部分”“即便犹抱琵琶半遮面,我们也能瞬间认出熟悉的人和物”。这些事实提示了人类视觉系统的“设计”似乎非常严格地遵守着自然进化中最普适的法则,即最低的资源消耗、最小的信息损失和最高的处理效率。与此同时,信息技术特别是传感器与计算机的发展直接导致了计算机视觉学科的诞生。从图像恢复,到三维重建,再到图像理解,直至当前炙手可热的生成式AI大模型,如文生图、文生视频等,“人工”视觉系统不断突破能力的边界,从感知到认知,再到生成,亦无不遵守着信息处理系统的最优化准则:最低能耗、最高质量和最快速度,其核心与自然进化法则几乎完全一致。这种“碳基”与“硅基”视觉系统在设计原则上的“殊途同归”并非偶然,而是信息科技和生物医学不断交融、相互解读的产物。因此毫不讳言,不管是从生物学还是从计算机科学的单一角度去学习视觉系统的知识,往往会偏离视觉原理最深刻的本质。 

《看见》是一本从“目标驱动设计”的独特视角,将眼视觉科学与计算机视觉知识脉络融为一体,全面系统讲述视觉科学原理和应用的优秀科普读物。全书从各视觉系统组成部分的“功能需求”入手,沿着从视觉感知(包括视觉信息的获取、传输、处理,图像目标的三维重建、运动捕捉等)到视觉认知(图像内容的语义理解)的逻辑层层深入,通过对生物视觉器官构造和计算机视觉算法架构的类比描述与对照剖析,深刻揭示了视觉系统的最基本的工作原理。值得一提的是,对于“最省、最准、最快”这一视觉系统最朴素也最重要的原理的阐述始终贯穿着本书的每一部分,而“生物视觉构造启发计算机视觉系统”的设计思想也处处体现在本书的重要模块中,如人眼屈光系统与CMOS光学成像原理、视网膜三级神经元细胞的分布特点与视觉信息的采样量化编码的原理、双目视差原理与三维重建技术等。这些知识点的结合能够帮助读者在学习原理的同时从“设计者”的角度深入洞察视觉系统的根本性需求和设计原则。众所周知,图像识别技术的突破开启了本轮人工智能的研究与应用热潮,本书亦从视觉神经认知计算的角度带领读者了解主流深度学习模型的结构与算法设计原理,帮助读者更加深刻地理解人工智能各种计算范式背后隐藏的生物学动机。当然,人类视觉过程的复杂程度远远超过目前神经与认知科学的发展水平,本书也试图从生成式人工智能(如图像生成算法)的视角去诠释大脑皮层形成特定视觉模式、记忆、认知、推理的工作原理,特别是融合神经科学、数学、计算机和认知心理学等多个领域的交叉知识,探索“脑—心—眼”如何协同产生视觉感知与认知的“真相”。 

纵观全书,眼视觉科学与计算机视觉的结合为我们提供了无尽的启示。从最基本的光学原理到复杂的图像理解技术,本书不仅描绘了计算机视觉系统如何通过模拟人眼的工作机理实现各种“类人”视觉任务的过程,同时也展望了如何借助更先进的传感器技术、更高速的运算能力和更优秀的算法框架,突破生物视觉能力的局限,实现更精确、更广泛、更高效的视觉感知与认知。值得一提的是,本书在讲解视觉科学的原理时,时常类比日常生活中熟悉而有趣的案例,引述读者们感兴趣的摄影学、机器人学、AR/VR、眼科学等关联知识,帮助读者在沉浸式的阅读体验中轻松理解复杂的原理;同时,本书附有大量精美插图,这些图例将生物视觉原理与计算机视觉算法的工作原理巧妙结合,帮助读者在理解基础概念的同时,也能欣赏到科学背后蕴藏的美感,使得本书成为一本富有创意与视觉冲击力的科普读物。 

我相信,《看见》不仅仅为读者提供了视觉科学的基础知识,更能激发我们对生物视觉和计算机视觉背后复杂机制的探索与思考。基于作者对于知识体系与呈现方式的可伸缩性编排,本书的目标阅读人群非常宽泛:不仅可以作为普通大众的一般性科普读物,亦可以作为从事人工智能+眼科学交叉方向的学生与研发人员的技术启蒙教材。对于科研人员,本书使我们在理解技术的同时,更加尊重自然界的智慧,并以此为基础,开创未来新的科学与技术突破。 

最后,我衷心祝愿这本书能够启发更多读者的思维,激发他们对科学和技术的兴趣与热情,为我国智能眼科、智慧计算视觉领域的交叉人才培养作出独特的贡献。

上海交通大学李政道研究所所长 

中国科学院院士 张杰

来源:百道网

(点击图片 进入论坛)

加编辑群提问

百道网

百道网

百道网

百道网

点击图片 查看详情

相关文章

发表评论前,请先