释放多核潜能:英特尔Parallel Studio并行开发指南
¥
10
2.5折
¥
39.8
九品
仅1件
作者英特尔亚太研发有限公司、并行科技 编
出版社清华大学出版社
出版时间2010-09
版次1
装帧平装
货号Z4
上书时间2025-01-01
商品详情
- 品相描述:九品
图书标准信息
-
作者
英特尔亚太研发有限公司、并行科技 编
-
出版社
清华大学出版社
-
出版时间
2010-09
-
版次
1
-
ISBN
9787302235033
-
定价
39.80元
-
装帧
平装
-
开本
16开
-
纸张
胶版纸
-
页数
287页
-
字数
475千字
-
正文语种
简体中文
- 【内容简介】
-
《释放多核潜能:英特尔ParallelStudio并行开发指南》采用工程理论、工具详解和实际案例分析相结合的方式,全面介绍了英特尔ParallelStudio工具集的使用。全书分三部分:基础部分(第1、2章)介绍了多核架构、并行编程的关键理论,ParallelStudio的特点以及一些简单案例;中级部分(第3~12章)详述了ParallelStudio各个组件的使用,是《释放多核潜能:英特尔ParallelStudio并行开发指南》的重点;提高部分(第13章)选取了来自英特尔线程挑战赛的4个算例和1个商业软件并行优化案例,提供了从工程实际角度解决并行问题的视角。
《释放多核潜能:英特尔ParallelStudio并行开发指南》适合所有对并行开发技术感兴趣的人员,包括具备一定编程经验的程序员、调试人员,计算密集型行业的高性能计算架构师、性能优化分析师,并行开发的研究人员,对英特尔ParallelStudio感兴趣的技术决策者等。此外,《释放多核潜能:英特尔ParallelStudio并行开发指南》也可作为高等院校计算机专业并行开发相关课程的培训及社会实践参考用书。
- 【作者简介】
-
并行科技北京并行科技有限公司(以下简称并行科技),是一家专注于高性能计算软件与技术服务的高新技术企业,与英特尔等软硬件厂商有着密切的合作伙伴关系,主要客户包括科研院所、能源、气象、制造、金融、互联网等计算密集型用户。在程序并行化、优化领域,并行科技拥有自主知识产权的Paramon、Paraview专业工具,积累了从搜集应用特征、定位性能瓶颈到分级优化的系统方法,被誉为“性能专家”。同时,并行科技作为英特尔软件代理商,也为用户提供卓越的英特尔软件技术支持、培训等。英特尔高性能计算支持团队英特尔高性能计算支持团队,专注于多核平台和服务器集群的并行应用优化,负责为国内高性能计算和互联网数据中心用户,提供应用性能优化、代码并行、应用特征分析、开发工具培训以及并行解决方案建议和评估等工程支持,在石油勘探、制造业、气候气象、生命科学和互联网搜索引擎等大规模并行应用领域积累了丰富的经验。英特尔软件工具技术顾问团队英特尔软件工具技术顾问团队,由英特尔各领域专家组成,为所有英特尔软件工具,如C/C++编译器、Fortran编译器、VTune性能分析器、核心数学库、英特尔ParallelStudio等,提供专业的售前、售后服务,并提供相关技术的高级培训。
- 【目录】
-
第1章并行开发理论基础
1.1并行相关概念
1.1.1并发与并行、并行度
1.1.2粒度
1.1.3加速比及其定律
1.1.4可扩展性与并行效率
1.1.5负载均衡
1.1.6吞吐量与延迟
1.1.7热点与瓶颈
1.2多核并行
1.2.1多核软硬件现实
1.2.2多核架构
1.2.3多核并行手段
1.2.4多核并行设计方法
1.2.5多核多线程系统
1.2.6多核多线程同步
1.2.7多核多线程实现的问题
1.3小结
第2章英特尔ParallelStudio基础
2.1英特尔ParallelStudio介绍
2.1.1英特尔ParallelStudio背景
2.1.2英特尔ParallelStudio的组成
2.1.3英特尔ParallelStudio的特色
2.1.4英特尔ParallelStudio的使用者
2.2英特尔ParallelStudio快速上手
2.2.1英特尔ParallelStudio的下载安装
2.2.2选择案例
2.2.3实践动手第一步:采用ParallelStudio运行串行程序
2.2.4实践动手第二步:选用合适的实现对代码并行化
2.2.5实践动手第三步:定位错误
2.2.6实践动手第四步:性能优化
2.3小结
第3章英特尔ParallelComposer详解
3.1Composer概述.
3.2英特尔C/C++编译器
3.2.1自动并行和OpenMP并行
3.2.2过程间优化
3.2.3档案导引优化
3.2.4编译器向量化
3.3英特尔并行调试器
3.3.1英特尔并行调试器概述
3.3.2线程数据共享侦测
3.3.3可重入函数调用侦测
3.3.4SSE寄存器窗口
3.3.5OpenMP多线程调试
3.3.6并行区域的串行执行
3.4英特尔TBB线程构建模块
3.4.1英特尔TBB概述
3.4.2功能模块分类与介绍
3.4.3编译和运行TBB多线程程序
3.5英特尔IPP性能基元
3.5.1英特尔IPP概述
3.5.2主要函数及其功能
3.5.3编译和运行
3.6小结
第4章并行化方法
4.1基本概念
4.1.1Amdahl定律
4.1.2进程与线程
4.2并行化方法
4.3并行化设计
4.3.1任务划分
4.3.2功能划分
4.3.3并行化开发中的一些思考
4.4案例分析:用蒙特卡罗方法计算x值
4.5小结
第5章英特尔ParallelComposer案例分析
5.1案例5-1:Composer的使用——向量化和自动并行化
5.2案例5-2:并行调试器的使用
5.3案例5-3:通过TBB进行字符串查找
5.4案例5-4:IPP压缩和解压缩案例介绍
5.5小结
第6章英特尔ParallelInspector详解
6.1Inspector概述
6.2启动Inspector
6.2.1工作流程
6.2.2启动
6.3配置查找错误的类型和粒度
6.3.1基于线程的相关错误及粒度
6.3.2基于内存的相关错误及粒度
6.4定位和解决发现的错误
6.4.1检查错误
6.4.2查看和分析错误
6.5小结
第7章软件纠错方法
7.1基本概念
7.1.1软件查错或纠错
7.1.2白盒测试
7.1.3黑盒测试
7.2并行软件的纠错
7.3线程并行的常见错误
7.3.1线程间死锁
7.3.2线程间竞争
7.3.3内存泄露
7.4小结
第8章并行软件纠错案例
8.1案例8-1:线程间相互作用导致的死锁问题
8.2案例8-2:线程竞争
8.3案例8-3:内存泄露
8.4小结
第9章英特尔ParallelAmplifier详解
9.1Amplifier概述
9.1.1如何开始Amplifier
9.1.2如何使用符号信息
9.1.3环境和对象
9.2Amplifier的几个概念
9.3Amplifier的分析运行
9.3.1分析运行的几个选项
9.3.2选择分析模式
9.3.3如何选择分析模式
9.3.4如何在命令行下运行分析模式
9.3.5热点:分析程序哪里耗时
9.3.6并行度:展现并行程序的另外一个特点
9.3.7锁和等待:分析程序在哪里等待
9.3.8选择数据采集的时段
9.4.Amplifier中浏览性能数据结果
9.4.1总览
9.4.2在Bottom-up和Top-down中切换
9.4.3选择和管理栈类型
9.4.4选择颜色方案
9.4.5按照不同类型划分组
9.4.6在命令行模式下查看性能数据
9.5Amplifier解释性能数据结果
9.5.1总览
9.5.2解释热点分析结果
9.5.3解释并行度分析结果
9.5.4.解释锁和等待分析结果
9.6Amplifier中的源代码
9.7Amplifier中对比性能数据结果
9.8Amplifier中管理结果文件
9.9小结
第10章性能优化方法
10.1性能优化概述
10.1.1性能和性能优化是计算机领域不变的主题
10.1.2性能优化的定义
10.2性能优化通用方法
10.2.1性能优化的顺序
10.2.2系统级别的性能优化
10.2.3应用级别的性能优化
10.2.4微架构级别的性能优化
10.2.5性能优化工作循环
……
第11章性能优化案例
第12章英特尔ParallelAdvisor详解
第13章总体系统化案例
附录A英文术语表
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价