• 经典并行与量子并行:提升并挖掘计算系统的潜在性能9787111750826
21年品牌 40万+商家 超1.5亿件商品

经典并行与量子并行:提升并挖掘计算系统的潜在性能9787111750826

正版图书,可开发票,请放心购买。

96.75 7.5折 129 全新

库存99件

广东广州
认证卖家担保交易快速发货售后保障

作者刘宇航 著

出版社机械工业出版社

ISBN9787111750826

出版时间2023-02

装帧平装

开本16开

定价129元

货号17727500

上书时间2024-12-24

哲仁书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
推荐序一 推荐序二 前言 第1章  计算概念的谱系 1.1  引言/ 2   1.2  计算概念谱系化的意义/ 3   1.3  计算概念的谱系/ 4   1.3.1  算势/ 5   1.3.2  算力/ 7   1.3.3  算术/ 10   1.3.4  算法/ 11   1.3.5  算礼/ 13   1.4  计算概念谱系组分的相互关系/ 14   1.5  从场的角度认识算势与算力的异同/ 16   1.6  证明与计算之间的关系/ 20   1.7  本章小结/ 23   1.8  思考题/ 23   参考文献/ 23   第2章  并行处理的意义及挑战 2.1  引言/ 26   2.2  并行计算机与应用和工艺的关系/ 26   2.3  并行处理的普遍性/ 28   2.4  多核微处理器技术/ 31   2.5  并行处理需要应对的挑战/ 35   2.6  并行处理的学科任务/ 40   2.7  本章小结/ 41   2.8  思考题/ 41   参考文献/ 41   第3章  并行处理的一般原理 3.1  引言/ 44   3.2  冯·诺依曼结构/ 44   3.3  通过实例说明指令级并行与数据依赖/ 47   3.4  通过实例说明线程级并行/ 49   3.5  延迟隐藏和延迟减少/ 55   3.6  并行处理技术的图形化表示/ 60   3.7  费林分类法/ 63   3.8  指令级并行/ 65   3.8.1  流水线技术/ 65   3.8.2  指令的动态调度/ 65   3.8.3  多发射技术/ 66   3.9  并行计算机系统的分类/ 67   3.9.1  向量计算机/ 67   3.9.2  多处理机/ 68   3.9.3  多主机/ 68   3.9.4  大规模并行处理计算机/ 68   3.10  并行结构的类型/ 69   3.10.1  单处理器的并行结构/ 69   3.10.2  多处理器的并行结构/ 69   3.10.3  处理机结构创新的历史/ 70   3.10.4  多核共享内存模型/ 73   3.10.5  多核消息传递模型/ 76   3.11  本章小结/ 80   3.12  思考题/ 81   参考文献/ 81   第4章  计算性能模型和存储性能模型 4.1  引言/ 84   4.2  并行执行时间效率模型/ 85   4.3  可扩展定律/ 103   4.3.1  阿姆达尔定律/ 103   4.3.2  古斯塔夫森-巴西斯定律/ 104   4.3.3  存储受限的扩展定律(孙-倪定律)/ 106   4.4  并行计算模型/ 112   4.4.1  PRAM模型/ 112   4.4.2  BSP模型/ 114   4.4.3  LogP模型/ 117   4.5  程序性能指标/ 120   4.5.1  单道程序工作负载的性能指标/ 120   4.5.2  多道程序工作负载的性能指标/ 122   4.6  存储系统的性能指标/ 123   4.6.1  平均存储访问时间/ 123   4.6.2  存储延迟与存储带宽/ 124   4.6.3  单位时钟周期完成的存储访问数量/ 126   4.6.4  并发平均存储访问时间/ 127   4.6.5  存储级并行性/ 130   4.6.6  并发感知的局部性/ 131   4.7  基准测试/ 133   4.7.1  基准测试的定义和分类/ 133   4.7.2  基准测试运行的规范/ 134   4.7.3  基准测试程序组的要求/ 134   4.7.4  基准测试的开发者/ 135   4.7.5  性能测试结果的总结/ 136   4.8  性能评估方式/ 136   4.8.1  Roofline模型/ 136   4.8.2  模拟器/ 151   4.8.3  需要避免的4个陷阱/ 160   4.9  本章小结/ 161   4.10  思考题/ 161   参考文献/ 161   第5章  共享存储结构与编程 5.1  引言/ 164   5.2  共享存储体系结构的类型/ 165   5.3  并行编程模型/ 168   5.3.1  抽象与实现的区别及其实例/ 168   5.3.2  通信与协作/ 176   5.3.3  通信层面三种并行编程模型的特点/ 187   5.3.4  混合编程模型/ 188   5.4  并行处理的流程/ 189   5.4.1  思路和实例/ 189   5.4.2  问题分解/ 193   5.4.3  任务分配/ 193   5.4.4  协调/ 194   5.4.5  进程映射/ 194   5.5  并行编程优化/ 205   5.5.1  静态分配与动态分配/ 206   5.5.2  延迟与带宽/ 214   5.5.3  内在通信与人为通信/ 217   5.6  减少通信的技术/ 221   5.6.1  利用时间局部性/ 221   5.6.2  利用空间局部性/ 222   5.7  共享内存体系结构/ 228   5.8  共享内存体系结构编程——OpenMP/ 242   5.9  实验——OpenMP/ 274 5.9.1  实验——OpenMP求sinx/ 274   5.9.2  实验——OpenMP求π值/ 278   5.9.3  实验——OpenMP求斐波那契数列第n项/ 283   5.9.4  实验——Gauss-Seidel迭代算法的并行实现及其优化/ 291   5.10  本章小结/ 296   5.11  思考题/ 296  参考文献/ 296   第6章  分布式存储结构与编程 6.1  引言/ 300   6.2  向量处理机体系结构/ 300   6.2.1  结构特点/ 300   6.2.2  性能分析/ 305   6.2.3  向量指令并行/ 307   6.2.4  向量链/ 307   6.2.5  向量分解strip-mining技术/ 308   6.2.6  向量条件执行/ 308   6.2.7  压缩/展开操作/ 309   6.2.8  向量归约/ 310   6.2.9  存储访问/ 311   6.2.10  分散和聚集/ 312   6.3  SIMD编程/ 327   6.3.1  SIMD简介/ 327   6.3.2  实现向量化的几种方法/ 327   6.3.3  向量化编译指令/ 328   6.3.4  向量化过程中的主要挑战/ 330   6.3.5  编译器向量化方式/ 335   6.3.6  循环变换/ 339   6.3.7  数据地址对齐/ 341   6.3.8  别名/ 341   6.3.9  条件语句/ 342   6.3.10  原生SIMD支持/ 342   6.4  CUDA编程/ 343   6.4.1  异构计算的定义/ 344   6.4.2  CUDA/ 345   6.4.3  GPU的并发控制/ 346   6.4.4  GPU的内存管理/ 347   6.4.5  SIMT/ 348   6.4.6  CUDA编程/ 349   6.4.7  CUDA与GPU硬件之间的映射/ 355   6.4.8  深流水线设计/ 356   6.4.9  GPU内存/ 356   6.4.10  GPU并发策略/ 358   6.4.11  库函数介绍/ 358   6.5  MPI编程/ 363   6.5.1  MPI在编程模型内的分类定位/ 363   6.5.2  信息交互模型与通信方式/ 364   6.5.3  MPI基本函数/ 367   6.5.4  MPI程序执行(以C on linux为例)/ 370   6.5.5  MPI集群通信函数/ 370   6.6  实验——编写MPI并行程序/ 379   6.6.1  编写MPI程序并行计算平均值/ 379   6.6.2  编写MPI程序并行计算矩阵向量乘法/ 381   6.6.3  编写MPI程序并行计算圆周率/ 383   6.7  实验——基于CUDA并发的矩阵乘法/ 386   6.8  本章小结/ 391   6.9  思考题/ 392   第7章  并行计算机系统的互连网络 7.1  引言/ 394   7.2  互连网络的基本概念/ 394   7.2.1  互连网络分层架构/ 394   7.2.2  互连网络相关参数/ 395   7.3  互连网络物理层/ 397   7.3.1  消息结构/ 397   7.3.2  物理层流控制/ 397   7.4  互连网络交换层/ 398   7.4.1  互连网络交换层功能与架构/ 398   7.4.2  互连网络交换层技术/ 399   7.5  互连网络路由层/ 402   7.5.1  互连网络拓扑结构/ 402   7.5.2  互连网络路由方式/ 409   7.5.3  路由协议结构/ 410   7.5.4  蝴蝶形拓扑结构路由算法/ 411   7.5.5  维序路由算法/ 412   7.5.6  死锁问题/ 413   7.6  互连网络软件层/ 415   7.6.1  互连网络软件层架构/ 415   7.6.2  性能分析/ 417   7.7  本章小结/ 418   7.8  思考题/ 419   第8章  并行计算机系统的资源调度 8.1  引言/ 422   8.2  相关工作/ 425   8.2.1  延迟敏感型应用延迟测量与建模/ 426   8.2.2  数据中心干扰的测度方法/ 427   8.2.3  资源管理使能技术/ 427 8.2.4  资源调度策略/ 429 8.3  延迟敏感型应用分析与建模/ 432   8.3.1  延迟敏感型应用概述/ 433   8.3.2  延迟敏感型应用延迟的组成及影响因素/ 435   8.3.3  平均延迟与尾延迟的关系/ 436   8.3.4  Littles law的尾延迟形式/ 441   8.4  数据中心干扰的测度/ 444   8.4.1  信息熵与系统熵/ 445   8.4.2  场景1:仅存在延迟敏感型应用时/ 445   8.4.3  场景2:仅存在尽力交付型应用时/ 446   8.4.4  场景3:延迟敏感型和尽力交付型应用混合运行时/ 447   8.4.5  系统熵的优点/ 447   8.5  资源调度策略/ 449   8.5.1  调度方法/ 450   8.5.2  实验验证/ 453   8.6  本章小结/ 459   8.7  思考题/ 460   参考文献/ 460   第9章  并行输入输出 9.1  引言/ 468   9.2  I/O软件栈/ 468   9.3  并行文件系统/ 469   9.4  常见并行文件系统/ 475   9.4.1  并行虚拟文件系统PVFS/ 475   9.4.2  通用并行文件系统GPFS/ 478   9.4.3  集群文件系统Lustre/ 479   9.5  POSIX/ 482   9.6  MPI-I/O/ 483   9.6.1  MPI-I/O的特性/ 483   9.6.2  MPI-I/O示例/ 485   9.6.3  MPI-I/O的底层读写优化/ 487   9.7  PnetCDF/ 490   9.8  本章小结/ 495   9.9  思考题/ 496   参考文献/ 496   第10章  高速缓存一致性、同步和事务性内存 10.1  引言/ 498   10.2  高速缓存一致性/ 498   10.2.1  基于总线的一致性协议/ 500   10.2.2  基于目录的一致性协议/ 502   10.3  目录结构/ 503   10.3.1  全映射位向量目录/ 503   10.3.2  有限指针目录/ 504   10.3.3  链式目录/ 505   10.3.4  粗糙向量目录/ 506   10.3.5  树形压缩向量目录/ 506   10.3.6  单级混合目录/ 507   10.3.7  多级目录/ 508   10.4  实现高速缓存一致的典型系统/ 511   10.4.1  Dash/ 511   10.4.2  Origin 2000/ 512   10.4.3  Alewife/ 513   10.4.4

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP