• 并行算法设计与性能优化
21年品牌 40万+商家 超1.5亿件商品

并行算法设计与性能优化

16.29 2.8折 59 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者刘文志

出版社机械工业出版社

ISBN9787111501022

出版时间2015-05

版次1

装帧平装

开本16开

纸张胶版纸

页数202页

字数99999千字

定价59元

上书时间2024-12-07

纵列風

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:并行算法设计与性能优化
定价:59.00元
作者:刘文志
出版社:机械工业出版社
出版日期:2015-05-01
ISBN:9787111501022
字数:200000
页码:202
版次:1
装帧:平装
开本:16开
商品重量:
编辑推荐

内容提要
本书主要介绍并行计算相关的算法的设计和并行计算的性能优化技巧,涵盖现代处理器的特性、衡量程序性能的方法、串行代码性能优化、并行编程模型及其环境、并行算法设计、遗留代码的并行处理、并行编程模型、混合并行等核心技法与实践技巧。
目录
前言章绪论1.1并行和向量化的作用1.2为什么要并行或向量化1.3为什么向量化或并行难1.4并行的替代方法1.5进程、线程与处理器1.6并行硬件平台1.7向量化和多核技术不是的1.8本章小结第2章现代处理器特性2.1指令级并行2.1.1指令流水线2.1.2乱序执行2.1.3指令多发射2.1.4分支预测2.1.5VLIW2.2向量化并行2.2.1SIMD2.2.2SIMT2.3线程级并行2.3.1内核线程和用户线程2.3.2多线程编程库2.3.3多核上多线程并行要注意的问题2.3.4多线程程序在多核和单核上运行的不同2.4缓存2.4.1缓存层次结构2.4.2缓存一致性2.4.3缓冲不命中2.4.4写缓存2.4.5越过缓存2.4.6硬件预取2.4.7缓存结构2.4.8映射策略2.5虚拟存储器和TLB2.6NUMA技术2.7本章小结第3章算法性能和程序性能的度量与分析3.1算法分析的性能度量标准3.1.1时间复杂度与空间复杂度3.1.2实现复杂度3.2程序和指令的性能度量标准3.3程序性能优化的度量标准3.3.1加速比与并行效率3.3.2Amdahl定律和Gustafson定律3.4程序性能分析实用工具3.5本章小结第4章串行代码性能优化4.1系统级别4.2应用级别4.3算法级别4.4函数级别4.4.1函数调用参数4.4.2内联小函数4.5循环级别4.5.1循环展开4.5.2循环累积4.5.3循环合并4.5.4循环拆分4.6语句级别4.6.1减少内存读写4.6.2选用尽量小的数据类型4.6.3结构体对齐4.6.4表达式移除4.6.5分支优化4.6.6优化交换性能4.7指令级别4.8本章小结第5章依赖分析5.1指令级依赖5.1.1结构化依赖5.1.2数据依赖5.1.3控制依赖5.2循环级依赖5.2.1循环数据依赖5.2.2循环控制依赖5.3寄存器重命名5.4本章小结第6章并行编程模型及环境6.1并行编程模型6.1.1指令级并行6.1.2向量化并行6.1.3易并行6.1.4任务并行6.1.5数据并行6.1.6循环并行化6.1.7流水线并行6.1.8区域分解并行6.1.9隐式和显式并行化6.1.10SPMD6.1.11共享存储器并行6.1.12分布式存储器并行6.2常见并行编程环境6.2.1MPI6.2.2OpenMP6.2.3fork/pthread6.2.4CUDA6.2.5OpenCL6.2.6OpenACC6.2.7NEON内置函数6.2.8SSE/AVX内置函数6.3本章小结第7章并行算法设计方法7.1划分7.1.1分而治之7.1.2划分原则7.1.3常见划分方法7.1.4并行性和局部性7.2通信7.2.1操作的原子性7.2.2结果的可见性7.2.3顺序一致性7.2.4函数的可重入与线程安全7.2.5volatile关键字7.2.6锁7.2.7临界区7.2.8原子操作7.2.9栅栏7.3结果归并7.4负载均衡7.4.1静态负载均衡7.4.2动态负载均衡7.4.3动态负载均衡算法的一般步骤7.5本章小结第8章并行算法缺陷8.1启动结束时间8.2负载均衡8.3竞写8.4锁8.4.1死锁8.4.2活锁8.5饿死8.6伪共享8.7原子操作8.8存储器栅栏8.9缓存一致性8.10顺序一致性8.11volatile同步错误8.12本章小结第9章并行编程模式实践9.1map模式9.2reduce模式9.3结合map和reduce模式9.4scan模式9.5zip/unzip模式9.6流水线模式9.7本章小结0章如何并行遗留代码10.1找出软件的计算热点10.2判断是否并行化热点10.3设计算法并实现10.3.1选择何种工具进行向量化或并行化10.3.2重构热点代码10.3.3依据硬件实现算法10.4将实现后的代码嵌入原软件10.4.1混合编译10.4.2动态链接库10.5示例:如何并行化word2vec10.6本章小结1章超级并行11.1超级并行方式编程11.1.1进程 线程11.1.2进程 GPU线程11.1.3线程 GPU线程11.1.4线程 向量指令11.1.5进程 线程 向量指令11.1.6进程 线程 GPU线程11.2矩阵乘法11.2.1多机CPU矩阵乘法11.2.2单机多GPU矩阵乘法11.2.3多机多GPU矩阵乘法11.3本章小结2章并行算法设计的一般准则12.1并行算法设计14准则12.2本章小结附录A整型数据与浮点数据
作者介绍
刘文志,花名风辰,毕业于科学院研究生院,闻名于并行计算江湖,尤善异构并行计算(X86、ARM、GPU、APU、PHI)和大规模集群计算相关技术,有7年相关经验,涉及图像处理、计算机视觉、数据挖掘和石油勘探。曾任英伟达并行计算工程师(协助建立英伟达北京CUDA团队)、百度在线高级研发工程师(协助建立百度深度学习实验室异构计算团队)。
序言

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP