百道网

ChatGPT的基本原理与核心算法

网店购买

内容简介

能够模仿人类语言智能 与思维,具有世界一般性知 识的ChatGPT,开启了通用 人工智能的新时代,正成为 引爆第四次工业革命的火种 。本书是 本体系化介绍 ChatGPT基本原理与核心算 法的教材及专业图书。全书 共分5章:第1章为人工神经 网络基础;第2章详细剖析 了Transformer及其缘起, 分析了视觉领域的 Transformer算法;第3章综 述了各种大型语言模型框架 ,分享了创建GPT系列模型 的思想之旅;第4章重点介 绍了ChatGPT的预训练方法 与微调算法,系统地阐述了 强化学习基础与基于人类反 馈的强化学习;第5章为 ChatGPT的应用,包括上下 文学习提示与思维链提示, 并讨论了智能涌现。本书体 系严谨、系统性强、逻辑严 密、内容丰富,不仅深入浅 出、图文并茂、特色鲜明, 而且具有 性、前瞻性和 思想启迪性。 本书可作为高等院校人 工智能、智能科学与技术、 计算机科学与技术、大数据 、自动驾驶、新一代机器人 及相关专业高年级本科生与 研究生教材,也可供上述专 业的研究人员、算法工程师 及从事AI产品研发,产业发 展与决策咨询等的工程技术 人员、投资者、战略研究者 和广大科技工作者参考。

作者简介

邓志东,CAA会士,CCF杰出会员。清华大学计算机科学与技术系教授,博士生导师,清华大学人工智能研究院视觉智能研究中心主任。目前的主要研究方向为人工智能(深度神经网络与大模型、深度强化学习)、自动驾驶、人形机器人。发表学术论文300余篇。