图解大模型：生成式AI原理与实战(全彩)

网店购买

购买

内容简介

本书全程图解式讲解，通过大量全彩插图拆解概念，让读者真正告别学模型的枯燥和复杂。全书分为三部分，依次介绍语言模型的原理、应用及优化。部分理解语言模型（ ~3章），解析语言模型的核心概念，包括词元、嵌入向量及Transformer架构，帮助读者建立基础认知。第二部分使用预训练语言模型（第4~9章），介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展，提升模型的应用能力。第三部分训练和微调语言模型（ 0~12章），探讨大模型的训练与微调方法，包括嵌入模型的构建、分类任务的优化及生成式模型的微调，以适应特定需求。本书适合对大模型感兴趣的开发者、研究人员和行业从业者。读者无须深度学习基础，只要会用Python，就可以通过本书深入理解大模型的原理并上手大模型应用开发。书中示例还可以一键在线运行，让学习过程轻松。

作者简介

Jay Alammar Cohere总监兼工程研究员，知名大模型技术博客Language Models & Co作者，DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者。 Jay的图解系列文章“The Illustrated Transformer”“The Illustrated DeepSeek-R1” 疯传，累积了几百万专业读者。 Maarten Grootendorst IKNL（荷兰综合癌症中心）临床数据科学家，知名大模型技术博客博主，BERTopic等开源大模型软件包作者（下载量超百万），DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者。译者李博杰智能体初创公司PINE AI联合创始人、首席科学家。曾任华为计算机网络与协议实验室副首席专家，入选华为首批“天才少年”项目。2019年获中国科学技术大学（USTC）与微软亚洲研究院（MSRA）联合培养博士学位，曾获ACM中国博士学位论文奖和微软学者奖学金。在SIGCOMM、SOSP、NSDI、USENIX ATC和PLDI等会议上发表多篇论文。