• AI系统:原理与架构
  • AI系统:原理与架构
  • AI系统:原理与架构
21年品牌 40万+商家 超1.5亿件商品

AI系统:原理与架构

120 6.0折 199 九五品

仅1件

江苏南京
认证卖家担保交易快速发货售后保障

作者陈仲铭 著

出版社科学出版社

出版时间2024-09

版次1

装帧精装

货号京C,10

上书时间2024-12-18

前程似锦图书城

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
图书标准信息
  • 作者 陈仲铭 著
  • 出版社 科学出版社
  • 出版时间 2024-09
  • 版次 1
  • ISBN 9787030792877
  • 定价 199.00元
  • 装帧 精装
  • 开本 20开
  • 页数 884页
  • 字数 1,328.000千字
【内容简介】
本书主要围绕AI系统的理论基础与技术基础知识展开,结合实例进行介绍,旨在让读者了解AI系统的来龙去脉,形成对AI系统的系统化与层次化的初步理解,掌握AI系统基本理论、技术、实际应用及研究方向,为后续从事具体的学习研究工作和项目开发工作奠定基础。

  本书首先介绍AI的历史、现状与发展及AI系统的基本知识,后分为AI硬件与体系结构、AI编译与计算架构、AI推理系统与引擎、AI框架核心模块四篇进行详细介绍,涉及AI系统从底层原理到应用落地的全貌,反映了AI系统架构的前沿技术。
【作者简介】
广州大学(本科)、西安电子科技大学(硕士)、东南大学(博士)华为?腾业务训练总架构师、MinSpore架构师AI系统架构出版《深度学习原理与实践》、《深度强化学习原理与实践》等4本专著,为早年 AI 知识的普及作了一定的铺垫作用。发表113篇算法专利,围绕智能驾驶、情景感知、AI系统底层的编译器、AI框架、上层应用算法构建了一系列的全包围专利点进行了重点布局。上海交通大学企业导师
【目录】


章 ai系统概述/1

1.1 ai历史与现状/1

1.2 ai发展驱动力/11

1.3 ai系统架构介绍/19

1.4 ai系统与ai算法关系/27

篇 ai硬件与体系结构

第2章 ai计算体系/37

2.1引言/37

2.2 ai计算模式/41

2.3关键设计指标/57

2.4核心计算之矩阵乘/63

2.5计算之比特位宽/67

第3章 ai芯片体系/72

3.1 cpu基础/72

3.2 cpu指令集架构/81

3.3 cpu计算本质/94

3.4 cpu计算时延/99

3.5 gpu基础/104

3.6 ai专用芯片基础/123

第4章 gpu——以英伟达为例/130

4.1 引言/130

4.2 tensor core基本/154

4.3 tensor core架构演进/160

4.4 tensor core深度剖析/171

4.5分布式通信/179

4.6 nvlink剖析 /186

4.7 nvswitch深度解析/194

第5章 tpu——以谷歌为例/202

5.1 引言/202

5.2 谷歌tpu v1脉动阵列/212

5.3 谷歌tpu v2训练芯片/219

5.4 谷歌tpu v3 pod服务器/228

5.5 谷歌tpu v4与光路交换/235

第6章 npu——以昇腾为例/244

6.1 引言/244

6.2 昇腾ai处理器/251

6.3 昇腾ai核心单元/259

6.4 昇腾数据布局转换/273

第7章 ai芯片思与展望/279

7.1 gpu架构与cuda关系/279

7.2 从gpu对ai芯片思/285

7.3 ai芯片发展方向/291

7.4 超异构计算/298

第二篇 ai编择与计算架构

第8章 传译器/311

8.1 引言/311

8.2传译器介绍/318

8.3 gcc基本介绍与特征/324

8.4 llvm架构设计和/329

8.5 llvm ir基本概念/334

8.6 llvm ir细节详解/340

8.7 llvm前端和优化层/345

8.8 llvm后端代码生成/350

第9章 ai编译器/356

9.1 引言/356

9.2 ai编译器历史阶段/365

9.3 ai编译器基本架构/371

9.4 ai编译器挑战与思/378

0章 前端优化/388

10.1 引言/388

10.2 图算ir/389

10.3 算子融合/393

10.4 布局转换/400

10.5 内存分配算法/406

10.6 常量折叠/412

10.7 公共子表达式消除/415

10.8 死代码消除/417

10.9 代数简化/420

1章 后端优化/425

11.1 弓1言/425

11.2 计算与调度/428

11.3 算子手工优化/434

11.4 算子循环优化/440

11.5 指令和存储优化/447

11.6 auto-tuning /452

2章 计算架构/454

12.1 芯片的编程体系/454

12.2 simd & simt与芯片架构/456

12.3 simd & simt与编程关系/465

12.4 cuda计算结构/470

3章 cann&ascend c计算架构/475

13.1 昇腾异构计算架构cann/475

13.2 cann与算子/482

13.3 算子开发编程语言ascend c/485

13.4 ascend c语法扩展/492

13.5 ascend c编程范式以向量为例/500

第三篇 ai推理系统与引擎

4章 推理系统/511

14.1 引言/511

14.2 推理系统介绍/515

14.3 推理流程全景/523

14.4 推理系统架构/526

14.5 推理引擎架构/530

14.6 昇腾推理引擎mrndle/549

14.7 昇腾计算语言ascendcl/552

5章 模型化/561

15.1 推理参数了解/561

15.2 n模型化/563

15.3 transformer模型化/579

6章 模型轻量化/585

16.1 引言/585

16.2 量化基本/586

16.3 感知量化训练/592

16.4 训练后量化与部署/598

16.5 模型剪枝/604

16.6 知识蒸馏/

7章 模型转换/619

17.1 引言/619

17.2 推理文件格式/626

17.3 自定义计算图/634

17.4 模型转换流程/643

8章 计算图优化架构/647

18.1 引言/647

18.2 离线图优化技术/651

18.3 其他计算图优化/667

9章 kernel优化/676

19.1 引言/676

19.2 卷积计算/680

19.3 im2col算法/690

19.4 wmograd算法/698

19.5 qnnpack算法/705

19.6推理内存布局/715

第四篇 ai框架核心模块

第20章 ai框架基础/721

20.1 引言/721

20.2 ai框架作用/721

20.3 ai框架之争/727

20.4 ai框架的编程范式/735

20.5 昇思mrndspore关键特/741

第21章 自动微分/753

21.1 引言/753

21.2 什么是微分/753

21.3 微分计算模式/760

21.4 微分实现方式/768

21.5 动手实现自动微分/775

21.6 动手实现pytorch微分/778

21.7 自动微分的挑战和未来/784

第22章 计算图/790

22.1 引言/790

22.2计算图基本/791

22.3计算图与自动微分/798

22.4计算图的调度与执行/804

22.5计算图的控制流实现/811

22.6动态图与静态图转换/818

第23章 分布式并行/823

23.1 引言/823

23.2数据并行/823

23.3数据并行/837

23.4张量并行/849

23.5流水并行/855

23.6混合并行/858

23.7 昇思 mindspore并行/860

参文献/867

索引/883

彩图

点击展开 点击收起

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP