AI系统:原理与架构
¥
120
6.0折
¥
199
九五品
仅1件
作者 陈仲铭 著
出版社 科学出版社
出版时间 2024-09
版次 1
装帧 精装
货号 京C,10
上书时间 2024-12-18
商品详情
品相描述:九五品
图书标准信息
作者
陈仲铭 著
出版社
科学出版社
出版时间
2024-09
版次
1
ISBN
9787030792877
定价
199.00元
装帧
精装
开本
20开
页数
884页
字数
1,328.000千字
【内容简介】
本书主要围绕AI系统的理论基础与技术基础知识展开,结合实例进行介绍,旨在让读者了解AI系统的来龙去脉,形成对AI系统的系统化与层次化的初步理解,掌握AI系统基本理论、技术、实际应用及研究方向,为后续从事具体的学习研究工作和项目开发工作奠定基础。 本书首先介绍AI的历史、现状与发展及AI系统的基本知识,后分为AI硬件与体系结构、AI编译与计算架构、AI推理系统与引擎、AI框架核心模块四篇进行详细介绍,涉及AI系统从底层原理到应用落地的全貌,反映了AI系统架构的前沿技术。
【作者简介】
广州大学(本科)、西安电子科技大学(硕士)、东南大学(博士)华为?腾业务训练总架构师、MinSpore架构师AI系统架构出版《深度学习原理与实践》、《深度强化学习原理与实践》等4本专著,为早年 AI 知识的普及作了一定的铺垫作用。发表113篇算法专利,围绕智能驾驶、情景感知、AI系统底层的编译器、AI框架、上层应用算法构建了一系列的全包围专利点进行了重点布局。上海交通大学企业导师
【目录】
章 ai系统概述/1 1.1 ai历史与现状/1 1.2 ai发展驱动力/11 1.3 ai系统架构介绍/19 1.4 ai系统与ai算法关系/27 篇 ai硬件与体系结构 第2章 ai计算体系/37 2.1引言/37 2.2 ai计算模式/41 2.3关键设计指标/57 2.4核心计算之矩阵乘/63 2.5计算之比特位宽/67 第3章 ai芯片体系/72 3.1 cpu基础/72 3.2 cpu指令集架构/81 3.3 cpu计算本质/94 3.4 cpu计算时延/99 3.5 gpu基础/104 3.6 ai专用芯片基础/123 第4章 gpu——以英伟达为例/130 4.1 引言/130 4.2 tensor core基本/154 4.3 tensor core架构演进/160 4.4 tensor core深度剖析/171 4.5分布式通信/179 4.6 nvlink剖析 /186 4.7 nvswitch深度解析/194 第5章 tpu——以谷歌为例/202 5.1 引言/202 5.2 谷歌tpu v1脉动阵列/212 5.3 谷歌tpu v2训练芯片/219 5.4 谷歌tpu v3 pod服务器/228 5.5 谷歌tpu v4与光路交换/235 第6章 npu——以昇腾为例/244 6.1 引言/244 6.2 昇腾ai处理器/251 6.3 昇腾ai核心单元/259 6.4 昇腾数据布局转换/273 第7章 ai芯片思与展望/279 7.1 gpu架构与cuda关系/279 7.2 从gpu对ai芯片思/285 7.3 ai芯片发展方向/291 7.4 超异构计算/298 第二篇 ai编择与计算架构 第8章 传译器/311 8.1 引言/311 8.2传译器介绍/318 8.3 gcc基本介绍与特征/324 8.4 llvm架构设计和/329 8.5 llvm ir基本概念/334 8.6 llvm ir细节详解/340 8.7 llvm前端和优化层/345 8.8 llvm后端代码生成/350 第9章 ai编译器/356 9.1 引言/356 9.2 ai编译器历史阶段/365 9.3 ai编译器基本架构/371 9.4 ai编译器挑战与思/378 0章 前端优化/388 10.1 引言/388 10.2 图算ir/389 10.3 算子融合/393 10.4 布局转换/400 10.5 内存分配算法/406 10.6 常量折叠/412 10.7 公共子表达式消除/415 10.8 死代码消除/417 10.9 代数简化/420 1章 后端优化/425 11.1 弓1言/425 11.2 计算与调度/428 11.3 算子手工优化/434 11.4 算子循环优化/440 11.5 指令和存储优化/447 11.6 auto-tuning /452 2章 计算架构/454 12.1 芯片的编程体系/454 12.2 simd & simt与芯片架构/456 12.3 simd & simt与编程关系/465 12.4 cuda计算结构/470 3章 cann&ascend c计算架构/475 13.1 昇腾异构计算架构cann/475 13.2 cann与算子/482 13.3 算子开发编程语言ascend c/485 13.4 ascend c语法扩展/492 13.5 ascend c编程范式以向量为例/500 第三篇 ai推理系统与引擎 4章 推理系统/511 14.1 引言/511 14.2 推理系统介绍/515 14.3 推理流程全景/523 14.4 推理系统架构/526 14.5 推理引擎架构/530 14.6 昇腾推理引擎mrndle/549 14.7 昇腾计算语言ascendcl/552 5章 模型化/561 15.1 推理参数了解/561 15.2 n模型化/563 15.3 transformer模型化/579 6章 模型轻量化/585 16.1 引言/585 16.2 量化基本/586 16.3 感知量化训练/592 16.4 训练后量化与部署/598 16.5 模型剪枝/604 16.6 知识蒸馏/ 7章 模型转换/619 17.1 引言/619 17.2 推理文件格式/626 17.3 自定义计算图/634 17.4 模型转换流程/643 8章 计算图优化架构/647 18.1 引言/647 18.2 离线图优化技术/651 18.3 其他计算图优化/667 9章 kernel优化/676 19.1 引言/676 19.2 卷积计算/680 19.3 im2col算法/690 19.4 wmograd算法/698 19.5 qnnpack算法/705 19.6推理内存布局/715 第四篇 ai框架核心模块 第20章 ai框架基础/721 20.1 引言/721 20.2 ai框架作用/721 20.3 ai框架之争/727 20.4 ai框架的编程范式/735 20.5 昇思mrndspore关键特/741 第21章 自动微分/753 21.1 引言/753 21.2 什么是微分/753 21.3 微分计算模式/760 21.4 微分实现方式/768 21.5 动手实现自动微分/775 21.6 动手实现pytorch微分/778 21.7 自动微分的挑战和未来/784 第22章 计算图/790 22.1 引言/790 22.2计算图基本/791 22.3计算图与自动微分/798 22.4计算图的调度与执行/804 22.5计算图的控制流实现/811 22.6动态图与静态图转换/818 第23章 分布式并行/823 23.1 引言/823 23.2数据并行/823 23.3数据并行/837 23.4张量并行/849 23.5流水并行/855 23.6混合并行/858 23.7 昇思 mindspore并行/860 参文献/867 索引/883 彩图
点击展开
点击收起
— 没有更多了 —
本店暂时无法向该地区发货
以下为对购买帮助不大的评价