¥ 4 九品
仅1件
作者张晨曦、王志英、沈立、李江峰、王伟 著
出版社清华大学出版社
出版时间2021-08
版次1
装帧平装
货号E76
上书时间2024-11-30
本书系统地论述了计算机系统结构的基本概念、基本结构、基本方法等,强调从开发并行性的角度、用量化分析(性能评价)的方法来研究和分析计算机系统,并且采用微课的形式,配备了教学动画和视频。
全书共分14章。第1章论述计算机系统的基本概念、并行性的发展和定量分析基础。第2章论述计算机指令系统的设计和MIPS指令系统。第3章论述流水线技术,包括性能分析、调度、相关与冲突以及流水线的实现。第4章论述向量处理机的结构、常用技术和性能评价。第5章和第6章分别论述如何用硬件和软件的方法来开发指令级并行性,包括Tomasulo算法、基于硬件的前瞻执行、多指令流出技术、循环展开、VLIW、EPIC等。第7章论述存储系统,重点论述Cache的基本知识及提高Cache性能的各种方法。第8章论述总线、通道处理机和RAID。第9章论述互连网络的特性参数、静/动态互连网络以及消息传递机制等。第10章论述SMP、DSM、MPP等并行计算机系统结构,论述多Cache一致性、同步、同时多线程。第11章论述多核架构以及基于多核的并行程序设计。最后3章分别论述机群系统、阵列处理机、数据流计算机。
本书内容丰富、实例具体、语言简练、可读性好,既可作为高等院校计算机及相关专业教材,也可作为相关科技人员的参考书。
张晨曦,男,1960年生,博士,国家杰青。同济大学软件学院教授,上海市教学名师,上海市模范教师,全军优秀教师。上海市教学成果一等奖获得者。作为课程负责人,获得过国j级精品课程两门,上海市精品课程两门。主编出版计算机教材14部,其中两部被评为国j级精品教材,并获上海市优秀教材一等奖,有3部被评为十二五国j级规划教材,有一部被国内100多所大学选为教材。
目录
第1章计算机系统结构的基础知识1
1.1计算机系统结构的基本概念1
1.1.1计算机系统的层次结构2
1.1.2计算机系统结构的定义3
1.1.3计算机组成和计算机实现3
1.1.4计算机系统结构的分类4
1.2计算机系统的设计7
1.2.1计算机系统设计的定量原理7
1.2.2计算机系统设计者的主要任务10
1.2.3计算机系统设计的主要方法12
1.3计算机系统的性能评测13
1.4计算机系统结构的发展17
1.4.1冯·诺依曼结构及其改进17
1.4.2软件对系统结构的影响19
1.4.3器件发展对系统结构的影响21
1.4.4应用对系统结构的影响22
1.5计算机系统结构中并行性的发展23
1.5.1并行性的概念23
1.5.2提高并行性的技术途径25
1.5.3单机系统中并行性的发展25
1.5.4多机系统中并行性的发展25
1.5.5并行机的发展变化26
习题128
第2章指令系统的设计30
2.1指令系统结构的分类30
2.2寻址方式32
2.3指令系统的设计和优化35
2.3.1指令系统设计的基本原则35目录计算机系统结构教程(第3版)2.3.2控制指令36
2.3.3指令操作码的优化37
2.3.4指令字格式的优化40
2.4指令系统的发展和改进42
2.4.1沿CISC方向发展和改进指令系统42
2.4.2沿RISC方向发展和改进指令系统44
2.5操作数的类型和大小45
2.6MIPS指令系统结构47
2.6.1MIPS的寄存器47
2.6.2MIPS的数据表示47
2.6.3MIPS的数据寻址方式47
2.6.4MIPS的指令格式48
2.6.5MIPS的操作49
2.6.6MIPS的控制指令50
2.6.7MIPS的浮点操作51
习题251
第3章流水线技术53
3.1流水线的基本概念53
3.1.1什么是流水线53
3.1.2流水线的分类55
3.2流水线的性能指标58
3.2.1流水线的吞吐率58
3.2.2流水线的加速比60
3.2.3流水线的效率61
3.2.4流水线的性能分析举例62
3.2.5流水线设计中的若干问题64
3.3非线性流水线的调度64
3.3.1单功能非线性流水线的最优调度65
3.3.2多功能非线性流水线的调度67
3.4流水线的相关与冲突70
3.4.1一条经典的5段流水线70
3.4.2相关与流水线冲突72
3.5流水线的实现83
3.5.1MIPS的一种简单实现83
3.5.2基本的MIPS流水线86
习题390
第4章向量处理机94
4.1向量的处理方式94
4.2向量处理机的结构96
4.2.1“存储器泊娲⑵鳌苯峁96
4.2.2“寄存器布拇嫫鳌苯峁96
4.3提高向量处理机性能的常用技术98
4.3.1设置多个功能部件99
4.3.2链接技术99
4.3.3分段开采技术102
4.3.4采用多处理机系统102
4.4向量处理机的性能评价103
4.4.1向量指令的处理时间Tvp103
4.4.2最大性能R∞和半性能向量长度n1/2106
4.4.3向量长度临界值n?瘙106
4.5向量处理机实例107
4.5.1具有代表性的向量处理机107
4.5.2Cray YMP和C90107
4.5.3NEC SXX44109
习题4110
第5章指令级并行及其开发――硬件方法112
5.1指令级并行的概念112
5.2相关与指令级并行113
5.3指令的动态调度114
5.3.1动态调度的基本思想114
5.3.2记分牌动态调度方法116
5.3.3Tomasulo算法123
5.4动态分支预测技术133
5.4.1采用分支历史表134
5.4.2采用分支目标缓冲器135
5.4.3基于硬件的前瞻执行137
5.5多指令流出技术142
5.5.1基于静态调度的多流出技术143
5.5.2基于动态调度的多流出技术144
5.5.3超长指令字技术147
5.5.4多流出处理器受到的限制148
5.5.5超流水线处理机149
习题5152
第6章指令级并行的开发――软件方法154
6.1基本指令调度和循环展开154
6.1.1指令调度的基本方法154
6.1.2循环展开156
6.2跨越基本块的静态指令调度158
6.2.1全局指令调度158
6.2.2踪迹调度161
6.2.3超块调度163
6.3静态多指令流出: VLIW技术165
6.4显式并行指令计算167
6.4.1非绑定分支167
6.4.2谓词执行168
6.4.3前瞻执行171
6.5开发更多的指令级并行173
6.5.1挖掘更多的循环级并行174
6.5.2软流水179
6.6实例: IA64体系结构182
6.6.1IA64的指令格式183
6.6.2IA64的谓词执行机制185
6.6.3IA64的前瞻执行机制186
习题6187
第7章存储系统189
7.1存储系统的层次结构189
7.1.1存储系统的层次结构概述189
7.1.2存储系统的性能参数190
7.1.3三级存储系统191
7.1.4存储层次的4个问题193
7.2Cache的基本知识193
7.2.1基本结构和原理193
7.2.2映像规则194
7.2.3查找方法196
7.2.4Cache的工作过程198
7.2.5替换算法200
7.2.6写策略203
7.2.7Cache性能分析204
7.2.8改进Cache性能206
7.3降低Cache的不命中率207
7.3.1三种类型的不命中207
7.3.2增加Cache块大小209
7.3.3增加Cache的容量210
7.3.4提高相联度210
7.3.5伪相联Cache211
7.3.6硬件预取212
7.3.7编译器控制的预取212
7.3.8编译优化213
7.3.9“牺牲”Cache215
7.4减少Cache不命中开销216
7.4.1采用两级Cache216
7.4.2让读不命中优先于写219
7.4.3写缓冲合并219
7.4.4请求字处理技术220
7.4.5非阻塞Cache技术220
7.5减少命中时间221
7.5.1容量小、结构简单的Cache221
7.5.2虚拟Cache221
7.5.3Cache访问流水化224
7.5.4踪迹Cache224
7.5.5Cache优化技术总结224
7.6并行主存系统225
7.6.1单体多字存储器226
7.6.2多体交叉存储器227
7.6.3避免存储体冲突231
7.7虚拟存储器232
7.7.1基本概念232
7.7.2快速地址转换技术233
7.7.3页式虚拟存储器实例: 64位Opteron的存储管理234
7.8实例: AMD Opteron的存储器层次结构236
习题7240
第8章输入输出系统243
8.1I/O系统的性能243
8.2I/O系统的可靠性、可用性和可信性244
8.3廉价磁盘冗余阵列245
8.3.1RAID0247
8.3.2RAID1247
8.3.3RAID2248
8.3.4RAID3249
8.3.5RAID4249
8.3.6RAID5250
8.3.7RAID6250
8.3.8RAID10与RAID01251
8.3.9RAID的实现与发展251
8.4总线252
8.4.1总线的设计253
8.4.2总线标准和实例254
8.4.3与CPU的连接255
8.5通道处理机257
8.5.1通道的作用和功能257
8.5.2通道的工作过程258
8.5.3通道种类259
8.5.4通道流量分析261
8.6I/O与操作系统263
8.6.1DMA和虚拟存储器263
8.6.2I/O和Cache数据一致性264
习题8266
第9章互连网络268
9.1互连函数268
9.1.1互连函数的表示方法268
9.1.2几种基本的互连函数269
9.2互连网络的结构参数与性能指标273
9.2.1互连网络的结构参数273
9.2.2互连网络的性能指标274
9.3静态互连网络275
9.4动态互连网络281
9.4.1总线网络281
9.4.2交叉开关网络282
9.4.3多级互连网络283
9.4.4动态互连网络的比较286
9.5消息传递机制287
9.5.1消息寻径方案287
9.5.2死锁与虚拟通道290
9.5.3流控制策略291
9.5.4选播和广播寻径算法294
习题9296
第10章多处理机298
10.1引言298
10.1.1并行计算机系统结构的分类298
10.1.2存储器系统结构和通信机制300
10.1.3并行处理面临的挑战302
10.2对称式共享存储器的系统结构304
10.2.1多处理机Cache一致性304
10.2.2实现一致性的基本方案305
10.2.3监听协议的实现308
10.3分布式共享存储器的系统结构312
10.3.1目录协议的基本思想312
10.3.2目录协议实例315
10.3.3目录的三种结构318
10.4同步320
10.4.1基本硬件原语320
10.4.2用一致性实现锁322
10.4.3同步性能问题324
10.5同时多线程326
10.5.1将线程级并行转换为指令级并行327
10.5.2同时多线程处理器的设计328
10.5.3同时多线程的性能329
10.6大规模并行处理机331
10.6.1并行计算机系统结构331
10.6.2大规模并行处理机333
10.7多核处理器及性能对比335
10.8多处理机实例――Origin 2000340
习题10347
第11章多核架构与编程348
11.1多核架构的需求348
11.1.1功耗与散热问题348
11.1.2并行度问题349
11.1.3应用软件问题350
11.2多核架构350
11.2.1多核的组织架构351
11.2.2多核架构实例352
11.3基于多核的并行程序设计355
11.3.1并行编程模型概述355
11.3.2共享存储模型与消息传递模型356
11.3.3并行语言358
11.3.4并行算法359
11.4多核编程实例359
11.4.1一个简单的OpenMP程序360
11.4.2OpenMP中的排序算法361
习题11 363
第12章机群系统365
12.1机群的基本结构366
12.1.1机群的硬件组成366
12.1.2机群的软件367
12.2机群的特点368
12.3机群的分类369
12.4典型机群系统简介370
12.4.1Berkeley NOW370
12.4.2Beowulf371
12.4.3LAMP371
12.4.4IBM SP2372
12.4.5天河2号373
习题12377
第13章阵列处理机379
13.1阵列处理机的操作模型和特点379
13.2阵列处理机的基本结构380
13.2.1分布式存储器的阵列机380
13.2.2共享存储器的阵列机381
13.3阵列处理机实例382
13.3.1实例1: Illiac Ⅳ阵列处理机382
13.3.2实例2: BSP计算机385
13.4阵列处理机的并行算法举例389
习题13393
第14章数据流计算机394
14.1数据流计算机的基本原理394
14.1.1数据驱动原理394
14.1.2数据流计算机中指令的执行过程395
14.1.3数据流计算机的指令结构396
14.2数据流程序图和数据流语言396
14.2.1数据流程序图396
14.2.2数据流语言及其性质400
14.3数据流计算机结构401
14.3.1静态数据流计算机401
14.3.2动态数据流计算机403
14.4数据流计算机的评价406
14.4.1数据流计算机的优点406
14.4.2数据流计算机的缺点407
14.4.3数据流计算机设计中需解决的问题408
习题14408
参考文献410
— 没有更多了 —
以下为对购买帮助不大的评价