• 大规模并行处理器程序设计(英文版原书第3版)/经典原版书库
21年品牌 40万+商家 超1.5亿件商品

大规模并行处理器程序设计(英文版原书第3版)/经典原版书库

正版图书,可开发票,请放心购买。

113.75 8.2折 139 全新

库存3件

广东广州
认证卖家担保交易快速发货售后保障

作者(美)大卫·B.柯克//胡文美|责编:曲熠

出版社机械工业

ISBN9787111668367

出版时间2021-01

装帧平装

开本其他

定价139元

货号31021297

上书时间2023-09-11

淘书宝店

九年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
Wen-MeiW.Hwu是伊利诺伊大学厄巴纳–香槟分校电气与计算机工程系的Sanders-AMD讲席教授。他的研究兴趣是并行计算的体系结构、实现、编译和算法领域。他是并行计算研究中心的首席科学家,IMPACT研究小组的负责人。他是MulticoreWare公司的联合创始人兼CTO。在研究和教学方面,他获得了ACMSigArchMauriceWilkes奖、ACMGraceMurrayHopper奖、TauBetaPiDanielC.Drucker杰出学者奖、ISCA影响力论文奖、IEEE计算机协会B.R.Rau奖以及加州大学伯克利分校计算机科学杰出校友奖。他是IEEE和ACM的会士。他主持UIUCCUDA卓越中心的工作,并且是NSFBlueWatersPetascale计算机项目的主要研究人员之一。Hwu博士在加州大学伯克利分校获得计算机科学博士学位。

目录
Preface
Acknowledgements
CHAPTER.1  Introduction
  1.1  Heterogeneous Parallel Computing
  1.2  Architecture of a Modern GPU
  1.3  Why More Speed or Parallelism
  1.4  Speeding Up Real Applications
  1.5  Challenges in Parallel Programming
  1.6  Parallel Programming Languages and Models
  1.7  Overarching Goals
  1.8  Organization of the Book
    References
CHAPTER.2  Data Parallel Computing
  2.1  Data Parallelism
  2.2  CUDA C Program Structure
  2.3  A Vector Addition Kernel
  2.4  Device Global Memory and Data Transfer
  2.5  Kernel Functions and Threading
  2.6  Kernel Launch
  2.7  Summary
    Function Declarations
    Kernel Launch
    Built-in (Predefined) Variables
    Run-time API
  2.8  Exercises
    References
CHAPTER.3  Scalable Parallel Execution
  3.1  CUDA Thread Organization
  3.2  Mapping Threads to Multidimensional Data
  3.3  Image Blur: A More Complex Kernel
  3.4  Synchronization and Transparent Scalability
  3.5  Resource Assignment
  3.6  Querying Device Properties
  3.7  Thread Scheduling and Latency Tolerance
  3.8  Summary
  3.9  Exercises
CHAPTER.4  Memory and Data Locality
  4.1  Importance of Memory Access Efficiency
  4.2  Matrix Multiplication
  4.3  CUDA Memory Types
  4.4  Tiling for Reduced Memory Traffic
  4.5  A Tiled Matrix Multiplication Kernel
  4.6  Boundary Checks
  4.7  Memory as a Limiting Factor to Parallelism
  4.8  Summary
  4.9  Exercises
……
CHAPTER 17 Parallel Programming and ComputationalThinking
  17.1  Goals of Parallel Computing
  17.2  Problem Decomposition

内容摘要
 本书是并行编程领域的必读之作,被图灵奖得主DavidPatterson誉为“天赐之书”。书中融会了两位作者多年来的教学和科研经验,被伊利诺伊大学厄巴纳一香槟分校(UIUC)、
麻省理工学院(MIT)等名校用作教材。
全书内容简洁、直观、
实用,强调计算思维能力和并行编程技巧,通过三个阶段的阶梯式教学逐步优化程序性能,最终实现高效的并行程序。书中不仅深入讲解了并行模式、
性能、CUDA动态并行等各项技术,而且用丰富的应用案例来闸释并行程序的开发过程。此外,本书还免费提供配套的Illinois-NVIDIAGPU教学工具箱,以及教学PPT、实验作业、
项目指南等资料。
与上一版相比,第3版对书中内容进行了全面修订,具体更新如下:·新增三章讨论并行模式,涵盖直方图计算、归并排序和图搜索。
·新增一章讨论深度学习应用案例。
·新增一章讨论CUDA高级特性的演进,并介绍了CuDNN等新库。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP