消息首页搜索举报

大规模并行处理器编程实战9787302237006科克、胡文美著；陈曙晖、熊淑华译出版社清华大学出版社

3 八五品

仅1件

陕西西安

认证卖家担保交易快速发货售后保障

作者科克、胡文美著；陈曙晖、熊淑华译

出版社清华大学出版社

出版时间2010-09

版次1

装帧平装

上书时间2024-06-30

西安电子科技大学慧众书店

十年老店

已实名进店收藏店铺

在售商品暂无
平均发货时间 11小时
好评率暂无

店主推荐
最新上架

朗文外研社新概念英语3 ¥1.00

新世纪计算机类本科规划教材：计算机网络（第2版） ¥1.00

现代广告学 ¥9.00

高等数学学习指导（第2版）（上册） ¥12.00

工程数学：线性代数（第4版） ¥1.00

机械原理（第7版）9787040192100孙桓葛文杰陈作模高等教育出版社 ¥5.00

高等学校教材系列：工程线性代数（MATLAB版） ¥77.00

数据库系统概论 ¥3.00

管理学（第3版） ¥1.00

等离子体科学和技术 2022年 Volume 24, Number 3, Plasma Science and Technology ISSN 1009-0630 ¥87.00

力学习题与解答（第二版）21世纪物理规划教材·基础课系列 9787301326909舒幼生北京大学出版社 ¥12.00

力学（物理类）（第二版）21世纪物理规划教材·基础课系列9787301335949 北京大学物理学院舒幼生教授编著新版 ¥27.00

新时代大学英语综合教程 9787513822626 张文霞华语教学出版社 ¥11.00

新时代大学英语综合教程第2册基础篇--9787513821834华语教学2023-04-01 ¥10.00

大学英语听说教程2 (第二版第2版智慧版）陈向京外语教学与研究出版社 9787521342895 正版旧书 ¥5.00

【正版二手无激活码】大学英语听说教程1智慧版陈向京外研社外语教学与研究出版社 9787521342840 ¥5.00

深入浅出程序设计竞赛（基础篇）9787040542769汪楚奇著出版社高等教育出版社 ¥16.00

通用学术英语视听说（研究生通用学术英语系列）9787569316476刘美岩著；郎曼、侯霞编出版社西安交通大学出版社 ¥19.00

商品详情

品相描述：八五品

图书标准信息

作者科克、胡文美著；陈曙晖、熊淑华译
出版社清华大学出版社
出版时间 2010-09
版次 1
ISBN 9787302237006
定价 39.00元
装帧平装
开本 16开
纸张胶版纸
页数 211页
字数 293千字
正文语种简体中文
原版书名 Programming Massively Parallel Processors: A Hands-on Approach

【内容简介】: 《大规模并行处理器编程实战》介绍了学生和专业人员都适合的并行编程与gpu体系结构的基本概念，详细剖析了编写并行程序所需的各种技术，用案例研究说明了并行程序设计的整个开发过程，即从计算思想开始，直到最终实现高效可行的并行程序。《大规模并行处理器编程实战》特色：介绍了计算思想，可以使读者能够在实现高性能并行计算的基础上来考虑和解决问题。如何使用cuda（统一计算设备架构），cuda是nvidia公司专门为大规模并行环境创建的软件开发工具。如何使用cuda编程模型和opencl同时实现高性能和高可靠性。
【作者简介】: 科克（DavidB.Kirk），博士：美国国家工程院院士，NVIDIA公司首席科学家，拥有麻省珲工学院的机械工程学学士和硕十学位，加州理工学院的计算机科学博士学位。Kirk博士是50项与图形芯片设计相关的专利和专利申请的发明者，发表了50多篇关于图形处理技术的论文，是可视化计算技术方面的权威。
胡文美（Wen－meiW.Hwu），教授：拥有美国加州大学伯克利分校计算机科学博士学位，担任伊利诺伊大学厄巴纳一香槟分校协调科学实验室的电气和计算机工程主席，领导IMPACT研究中心并负责OpenIMPACT项目，该项目为计算机行业提供编译器和计算机架构新技术。Hwu教授还担任通用并行计算研究中心联合主任，是全球首个ACUDA卓越中心首席研究员。
【目录】: 第1章引言1
1.1gpu与并行计算机2
1.2现代gpu的体系结构7
1.3为什么需要更高的速度和并行化8
1.4并行编程语言与模型11
1.5综合目标12
1.6本书的组织结构13

第2章gpu计算的发展历程17
2.1图形流水线的发展18
2.1.1固定功能的图形流水线时代18
2.1.2可编程实时图形流水线的发展21
2.1.3图形与计算结合的处理器23
2.1.4gpu：一个中间步骤25
2.2gpu计算26
2.2.1可扩展的gpu27
2.2.2发展近况27
2.3未来发展趋势28

第3章cuda简介31
3.1数据并行性32
3.2cuda的程序结构33
.3.3矩阵乘法示例34
3.4设备存储器与数据传输37
3.5kernel函数与线程41
3.6小结45
3.6.1函数声明45
3.6.2启动kernel函数46
3.6.3预定义变量46
3.6.4运行时api46

第4章cuda线程49
4.1cuda线程组织结构50
4.2使用blockidx和threadidx54
4.3同步与透明可扩展性58
4.4线程分配59
4.5线程调度和容许延时60
4.6小结62
4.7习题63

第5章cuda存储器模型65
5.1存储器访问效率的重要性66
5.2cuda设备存储器的类型67
5.3减少全局存储器流量的策略70
5.4存储器——限制并行性的一个因素76
5.5小结77
5.6习题78

第6章性能优化79
6.1更多关于线程执行的问题80
6.2全局存储器的带宽86
6.3sm资源的动态划分93
6.4数据预取95
6.5指令混合97
6.6线程粒度98
6.7可度量的性能和小结99
6.8习题100

第7章浮点运算105
7.1浮点格式106
7.1.1m的规范化表示106
7.1.2e的余码表示107
7.2能表示的数109
7.3特殊的位模式与精度113
7.4算术运算的准确度和舍入114
7.5算法的优化114
7.6小结115
7.7习题116

第8章应用案例研究：高级mri重构117
8.1应用背景118
8.2迭代重构120
8.3计算fhd123
8.4最终评估139
8.5习题142

第9章应用案例研究：分子可视化和分析143
9.1应用背景144
9.2kernel函数简单的实现方案145
9.3指令执行效率149
9.4存储器合并151
9.5附加性能比较154
9.6采用多gpu156
9.7习题157

第10章并行编程和计算思想159
10.1并行编程的目标160
10.2问题分解161
10.3算法选择163
10.4计算思想168
10.5习题169

第11章opencl简介171
11.1背景172
11.2数据并行性模型173
11.3设备的体系结构175
11.4kernel函数176
11.5设备管理和启动kernel177
11.6opencl中的静电势图谱179
11.7小结183
11.8习题184

第12章结论与展望185
12.1重申目标186
12.2存储器体系结构的演变187
12.2.1大型虚拟和物理地址空间187
12.2.2统一的设备存储空间188
12.2.3可配置的缓存和暂时存储器188
12.2.4提高原子操作的速度189
12.2.5提高全局存储器的访问速度189
12.3kernel函数执行控制过程的演变190
12.3.1kernel函数内部的函数调用190
12.3.2kernel函数中的异常处理190
12.3.3多个kernel函数的同步执行191
12.3.4可中断的kernel函数191
12.4内核的性能191
12.4.1双精度的速度191
12.4.2提高控制流的效率192
12.5编程环境192
12.6美好前景193
附录a矩阵乘法主机版的源代码195
附录bgpu的计算能力207

点击展开点击收起

— 没有更多了 —

大规模并行处理器编程实战9787302237006科克、胡文美 著；陈曙晖、熊淑华 译 出版社清华大学出版社

西安电子科技大学慧众书店

商品详情

图书标准信息

大规模并行处理器编程实战9787302237006科克、胡文美著；陈曙晖、熊淑华译出版社清华大学出版社