大模型导论
¥
35.94
5.1折
¥
69.8
九五品
仅1件
作者张成文
出版社人民邮电出版社
ISBN9787115637987
出版时间2024-07
版次1
装帧平装
开本16开
纸张胶版纸
定价69.8元
上书时间2024-12-18
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:大模型导论
定价:69.80元
作者:张成文
出版社:人民邮电出版社
出版日期:2024-07-01
ISBN:9787115637987
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
·内容全面,本书涵盖大模型技术的各个方面,包括大模型的概念、数据预处理、Transformer、预训练与微调、模型推理以及案例实战等。·内容循序渐进,从大模型基础概念到开发架构全案例式讲解,通过实战引导读者掌握大模型技术。·注重实用,附赠源码,丰富学习方式,边学边练。·提供丰富的教学资源,适合高校教学和大模型领域从业者使用,满足不同层次读者的需求。
内容提要
本书主要介绍了大模型的发展与演变、相关技术、应用场景、未来发展趋势和前景。本书首先回顾了大模型技术的起源和发展历程,然后介绍了数据预处理、Transformer、预训练与微调、模型推理和PyTorch框架等技术。此外,本书还通过具体的案例和实践展示了如何应用大模型技术来解决实际问题。本书旨在帮助读者全面了解大模型技术的发展与应用,并推动其在各个领域的应用和发展。本书图文并茂,理论翔实,案例丰富,适合从事大模型开发的科研人员以及广大的开发者作为技术参考和培训资料,亦可作为高校本科生和研究生的教材。
目录
章 大模型概述 11.1 大模型介绍 21.1.1 生成原理 41.1.2 关键技术 51.1.3 关键术语 101.2 大模型分类 111.2.1 按模型结构划分 121.2.2 按模态划分 121.2.3 按微调方式划分 131.2.4 带插件系统的大模型 131.3 大模型的开发流程 131.3.1 确定项目目标 141.3.2 数据准备 151.3.3 模型设计 161.3.4 模型训练 161.3.5 模型部署 171.3.6 模型应用 171.4 应用场景 181.5 未来发展方向 201.5.1 AI智能体 201.5.2 具身智能 211.6 小结 221.7 课后习题 22第 2章 数据预处理 232.1 文本数据预处理 232.1.1 构造方法 242.1.2 构造流程 262.1.3 处理手段 282.1.4 常用类库 372.2 图像数据预处理 472.2.1 图像去噪 482.2.2 图像重采样 522.2.3 图像增强 532.3 图文对数据预处理 562.4 Datasets库 582.4.1 安装与配置 582.4.2 使用方法 582.5 小结 632.6 课后习题 64第3章 Transformer 653.1 注意力机制 653.1.1 自注意力机制 663.1.2 多头自注意力机制 683.2 Transformer简介 703.2.1 位置编码 703.2.2 整体结构 713.2.3 稀疏Transformer 723.3 Visual Transformer简介 733.3.1 模型结构 743.3.2 与Transformer对比 753.4 Q-Former 753.5 transformers库 773.5.1 基本组成 773.5.2 使用方法 783.5.3 微调实践 833.6 小结 853.7 课后习题 86第4章 预训练 874.1 预训练介绍 874.1.1 发展历程 884.1.2 模型类型 884.1.3 掩码预训练 894.2 预训练任务 894.3 应用于下游任务的方法 914.3.1 迁移学习 914.3.2 微调 914.4 预训练模型的应用 924.5 小结 934.6 课后习题 93第5章 训练优化 945.1 模型训练挑战 945.2 训练优化技术 955.2.1 数据并行 955.2.2 模型并行 975.2.3 流水线并行 985.2.4 混合精度训练 995.3 训练加速工具 1005.3.1 DeepSpeed 1005.3.2 Megatron-LM 1035.3.3 Colossal-AI 1045.3.4 BMTrain 1045.4 小结 1075.5 课后习题 108第6章 模型微调 1096.1 监督微调 1106.2 PEFT技术 1106.2.1 Adapter tuning 1116.2.2 Prefix tuning 1116.2.3 Prompt tuning 1126.2.4 P-tuning v1 1136.2.5 P-tuning v2 1146.2.6 LoRA 1146.2.7 QLoRA 1156.3 PEFT库 1166.3.1 关键步骤 1176.3.2 微调方法 1186.4 小结 1246.5 课后习题 124第7章 模型推理 1257.1 模型压缩和加速技术 1257.1.1 模型量化 1267.1.2 知识蒸馏 1277.1.3 模型剪枝 1307.1.4 稀疏激活 1327.2 推理服务提升技术 1337.2.1 KV Cache 1347.2.2 PagedAttention 1347.3 小结 1367.4 课后习题 136第8章 PyTorch框架 1378.1 安装与配置 1378.2 基础组件 1388.2.1 张量 1388.2.2 CUDA张量 1428.2.3 Autograd 1448.2.4 DataLoader 1468.3 构建线性回归模型 1488.4 构建Transformer模型 1518.4.1 数据准备与参数设置 1518.4.2 位置编码 1538.4.3 掩码操作 1548.4.4 注意力计算 1548.4.5 前馈神经网络 1558.4.6 编码器与解码器 1558.4.7 构建Transformer 1578.4.8 模型训练 1578.4.9 模型测试 1588.5 小结 1588.6 课后习题 159第9章 向量数据库 1609.1 Milvus 1609.1.1 安装与配置 1619.1.2 Milvus 1.0的基本操作 1629.1.3 Milvus 2.0的基本操作 1639.2 Pinecone 1669.2.1 注册与配置 1669.2.2 基本操作 1669.3 Chroma 1689.3.1 安装与配置 1689.3.2 基本操作 1689.4 小结 1709.5 课后习题 1700章 前端可视化工具 17110.1 Gradio 17110.1.1 Gradio安装 17210.1.2 常用操作 17210.1.3 Interface使用详解 17510.1.4 Blocks使用详解 17610.2 Streamlit 17810.2.1 安装与配置 17810.2.2 数据展示API 18010.2.3 控件API 18210.2.4 页面布局API 18410.2.5 状态存储 18510.3 小结 18510.4 课后习题 1861章 LangChain 18711.1 LangChain组件 18711.1.1 Models 18811.1.2 Prompts 18811.1.3 Indexes 19011.1.4 Memory 19011.1.5 Chains 19411.1.6 Agents 19611.2 基础操作 19911.2.1 Prompts的用法 20011.2.2 Chains的用法 20111.2.3 Agents的用法 20211.2.4 Memory的用法 20411.3 进阶实战 20511.3.1 对话式检索问答 20511.3.2 长短文本总结 20711.3.3 结合向量数据库实现问答 20911.4 基于私域数据的问答系统 21111.4.1 环境准备 21211.4.2 模型测试 21311.4.3 构建提示词模板 21311.4.4 生成词向量 21411.4.5 创建向量数据库 21611.4.6 构建问答系统 21711.5 小结 21911.6 课后习题 2192章 常用开源模型的部署与微调 22012.1 ChatGLM3模型部署与微调 22012.1.1 环境准备 22012.1.2 载入模型 22212.1.3 数据准备 22412.1.4 定义模型 22812.1.5 模型训练 23012.1.6 保存模型 23212.1.7 模型评估 23212.2 Baichuan2模型部署与微调 23312.2.1 环境准备 23312.2.2 载入模型 23412.2.3 数据准备 23812.2.4 定义模型 24112.2.5 模型训练 24212.2.6 保存模型 24412.2.7 模型评估 24512.3 LLaMA2模型部署与微调 24712.3.1 模型使用申请 24812.3.2 环境准备 24812.3.3 载入模型 24912.3.4 数据准备 25012.3.5 模型训练 25112.3.6 保存模型 25412.3.7 模型评估 25512.4 小结 25612.5 课后习题 256参考文献 257
作者介绍
张成文,博士,北京邮电大学副教授、硕士生导师。中国人工智能学会高级会员,任中国电子商会大模型应用产业专委会秘书长、中国人工智能产业发展联盟产学研工作组副组长,中国医学装备协会人工智能和医用机器人工作委员会常委、中国教育发展战略学会人工智能与机器人专委会理事等。他在网络技术专业领域有着深入的研究,并且完成了国家科技重大专项、国家重点研发计划、国家自然科学基金等项目。专业方向包括人工智能、大数据个性化推荐、云计算、计算机视觉等。他在国内外期刊上发表了多篇高水平论文,并出版了多本教材和专著。
序言
— 没有更多了 —
以下为对购买帮助不大的评价