消息首页搜索举报

并行程序设计导论

正版保障假一赔十可开发票

77.3 6.0折 129 全新

库存65件

广东广州

认证卖家担保交易快速发货售后保障

作者(美)彼得·S.帕切科(Peter S. Pacheco)，(美)马修·马伦塞克(Matthew Malensek)著

出版社机械工业出版社

ISBN9787111743194

出版时间2024-05

装帧平装

开本16开

定价129元

货号16134338

上书时间2024-09-17

灵感书店

三年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 10小时
好评率暂无

最新上架

在路上，遇见时光 ¥28.76

高等院校法律主干课程系列教材-宪法学 ¥3.85

采矿工程岩石力学分析：以磁异常区多金属矿为例：Rock mechanics analysis of mining engineering：a case study of polymetallic ore in magnetic anomaly areas ¥58.72

诗画玉龙山(画册) ¥13.29

侗族:贵州黎平县九龙村调查 ¥7.70

鄂温克族:内蒙古鄂温克族旗乌兰宝力格嘎查调查 ¥4.24

云南省大学生资助工作优秀论文集 ¥8.09

实用写作(2009)(修订版) ¥4.62

云南社科成果集萃:云南省哲学社会科学“十五”规划课题选介:第二辑 ¥5.78

商品详情

品相描述：全新

商品描述: 目录
目录 An Introduction to Parallel Programming, Second Edition 译者序 前言 第1章为什么需要并行计算1 1.1 为什么需要不断提高性能1 1.2 为什么需要建立并行系统2 1.3 为什么需要编写并行程序2 1.4 如何编写并行程序5 1.5 我们将做什么6 1.6 并发、并行和分布式7 1.7 本书其余部分8 1.8 一点警告8 1.9 排版惯例9 1.10 小结9 1.11 练习10 第2章并行硬件与并行软件12 2.1 背景知识12 2.1.1 冯·诺依曼体系结构12 2.1.2 进程、多任务和线程13 2.2 冯·诺依曼模型的改进14 2.2.1 缓存基础14 2.2.2 缓存映射16 2.2.3 缓存和程序：示例17 2.2.4 虚拟内存18 2.2.5 指令级并行19 2.2.6 硬件多线程21 2.3 并行硬件22 2.3.1 并行计算机的分类22 2.3.2 SIMD系统22 2.3.3 MIMD系统24 2.3.4 互连网络26 2.3.5 高速缓存一致性30 2.3.6 共享内存与分布式内存32 2.4 并行软件33 2.4.1 注意事项33 2.4.2 协调进程/线程33 2.4.3 共享内存34 2.4.4 分布式内存37 2.4.5 GPU编程40 2.4.6 混合系统编程40 2.5 输入和输出41 2.5.1 MIMD系统41 2.5.2 GPU41 2.6 性能42 2.6.1 在MIMD系统中的加速比和 效率42 2.6.2 阿姆达定律44 2.6.3 MIMD系统的可扩展性45 2.6.4 MIMD程序的计时46 2.6.5 GPU性能48 2.7 并行程序设计49 2.7.1 示例49 2.8 编写和运行并行程序53 2.9 假设53 2.10 小结54 2.10.1 串行系统54 2.10.2 并行硬件55 2.10.3 并行软件56 2.10.4 输入和输出57 2.10.5 性能57 2.10.6 并行程序设计58 2.10.7 假设58 2.11 练习58 第3章基于MPI的分布式 内存编程62 3.1 入门62 3.1.1 编译和执行63 3.1.2 MPI程序64 3.1.3 MPI_Init和 MPI_Finalize64 3.1.4 通信域、MPI_Comm_size和MPI_Comm_rank65 3.1.5 SPMD程序66 3.1.6 通信66 3.1.7 MPI_Send66 3.1.8 MPI_Recv67 3.1.9 消息匹配68 3.1.10 status_p参数69 3.1.11 MPI_Send和MPI_Recv的 语义69 3.1.12 一些潜在的陷阱70 3.2 MPI中的梯形法则70 3.2.1 梯形法则70 3.2.2 梯形法则的并行化71 3.3 处理I/O74 3.3.1 输出74 3.3.2 输入75 3.4 集合通信76 3.4.1 树形结构的通信76 3.4.2 MPI_Reduce77 3.4.3 集合通信与点对点通信78 3.4.4 MPI_Allreduce79 3.4.5 广播80 3.4.6 数据分布82 3.4.7 分散83 3.4.8 收集84 3.4.9 综合实例85 3.5 MPI派生的数据类型88 3.6 MPI程序的性能评估91 3.6.1 计时91 3.6.2 结果93 3.6.3 加速比和效率95 3.6.4 可扩展性95 3.7 一种并行排序算法96 3.7.1 一些简单的串行排序算法96 3.7.2 并行奇偶移项排序98 3.7.3 MPI程序中的安全性100 3.7.4 关于并行奇偶排序的一些 补充细节102 3.8 小结103 3.9 练习106 3.10 编程作业112 第4章 Pthreads共享内存编程114 4.1 进程、线程和Pthreads114 4.2 Hello, world115 4.2.1 执行116 4.2.2 预备117 4.2.3 启动线程117 4.2.4 运行线程119 4.2.5 停止线程120 4.2.6 错误检查120 4.2.7 启动线程的其他方法120 4.3 矩阵-向量乘法121 4.4 临界区123 4.5 忙等待126 4.6 互斥锁128 4.7 生产者-消费者同步和信号量131 4.8 栅栏和条件变量135 4.8.1 忙等待和互斥锁135 4.8.2 信号量136 4.8.3 条件变量137 4.8.4 Pthreads栅栏139 4.9 读写锁139 4.9.1 排序的链表函数140 4.9.2 多线程链表142 4.9.3 Pthreads的读写锁144 4.9.4 各种实现方案的性能145 4.9.5 实现读写锁146 4.10 缓存、缓存一致性和伪共享147 4.11 线程安全150 4.11.1 不正确的程序可以产生 正确的输出153 4.12 小结153 4.13 练习154 4.14 编程作业159 第5章 OpenMP共享内存编程161 5.1 入门162 5.1.1 编译和运行OpenMP程序163 5.1.2 程序163 5.1.3 错误检查165 5.2 梯形法则166 5.2.1 第一个OpenMP版本166 5.3 变量的作用域170 5.4 归约子句170 5.5 parallel指令173 5.5.1 注意事项174 5.5.2 数据依赖性175 5.5.3 寻找循环迭代相关176 5.5.4 估算π176 5.5.5 关于作用域的更多内容178 5.6 关于OpenMP中的循环的更多 内容：排序179 5.6.1 冒泡排序179 5.6.2 奇偶移项排序180 5.7 循环的调度182 5.7.1 schedule子句183 5.7.2 static调度类型185 5.7.3 dynamic和guided调度 类型185 5.7.4 runtime调度类型186 5.7.5 哪种调度187 5.8 生产者和消费者188 5.8.1 队列188 5.8.2 消息传递188 5.8.3 发送消息189 5.8.4 接收消息189 5.8.5 终止检测190 5.8.6 开始190 5.8.7 atomic指令191 5.8.8 临界区和锁191 5.8.9 在消息传递程序中使用锁193 5.8.10 critical指令、atomic 指令或锁194 5.8.11 注意事项194 5.9 缓存、缓存一致性和伪共享195 5.10 任务化199 5.11 线程安全202 5.11.1 不正确的程序可以产生 正确的输出204 5.12 小结204 5.13 练习208 5.14 编程作业211 第6章用CUDA进行GPU编程215 6.1 GPU和GPGPU215 6.2 GPU架构215 6.3 异构计算217 6.4 CUDA hello217 6.4.1 源代码218 6.4.2 编译与运行程序219 6.5 深入了解219 6.6 线程、线程块和线程网格220 6.7 NVIDIA计算能力和设备架构223 6.8 向量加法223 6.8.1 核函数224 6.8.2 Get_args函数225 6.8.3 Allocate_vectors函数和 托管内存226 6.8.4 main函数调用的其他函数227 6.8.5 显式内存传输229 6.9 从CUDA核函数返回结果231 6.10 CUDA梯形法则I233 6.10.1 梯形法则233 6.10.2 一种CUDA实现234 6.10.3 初始化、返回值和最后 更新235 6.10.4 使用正确的线程236 6.10.5 更新返回值和atomicAdd 函数236 6.10.6 CUDA梯形法则的性能237 6.11 CUDA梯形法则II：提升性能238 6.11.1 树形通信238 6.11.2 局部变量、寄存器、共享和 全局内存239 6.11.3 线程束和线程束洗牌240 6.11.4 使用线程束洗牌实现树形 全局求和241 6.11.5 共享内存和线程束洗牌的 替代方案242 6.12 用warpSize个线程块实现 梯形法则243 6.12.1 主机代码244 6.12.2 使用线程束洗牌的核函数244 6.12.3 使用共享内存的核函数244 6.12.4 性能245 6.13 CUDA梯形法则III：使用具有 多个线程束的线程块245 6.13.1 __syncthreads函数246 6.13.2 关于共享内存的更多内容247 6.13.3 使用共享内存的线程束 求和247 6.13.4 共享内存库248 6.13.5 收尾工作249 6.13.6 性能251 6.14 双调排序251 6.14.1 串行双调排序251 6.14.2 蝶式交换和二进制表示254 6.14.3 并行双调排序I256 6.14.4 并行双调排序II258 6.14.5 C

— 没有更多了 —

并行程序设计导论

灵感书店

商品详情

相关推荐