出版时间:2009-4 出版社:电子工业出版社 作者:张春元 等著 页数:275 字数:363000
前言
本书的由来 基于冯·诺依曼体系结构的传统程序设计模型和体系结构模型已经很好地运行了六十多年。但是,这个模型在当前VLSI工艺下,可靠性、功耗、计算效率、成本等都存在问题。全世界大量从事计算机系统研究、设计和制造的科学家和工程师们一直在设计新一代计算机体系结构方面做着不懈的探索。 近二十年来,国防科技大学计算机学院有很多老师带领研究生们一直专注于新型体系结构的研究,并且取得过很多创新性成果。我们课题小组的主要成员在20世纪 90年代初期攻读博士、硕士学位时,就开始关注国际上新型并行计算机体系结构的研究工作;随后的10年间,承担和参与了一系列国家自然科学基金项目、863项目和国家重点工程项目,获得了多项国家和部委级科技成果奖。2000年以后,我们课题组的老师和研究生们把学术研究的重点集中在高并行处理器技术领域。经过一段时间的学习和研究,到2003年,我们对该领域的研究进行了总结,课题组的研究重点逐步聚焦到以下4种并行结构: (1)以传统处理器为基础的片内多核结构; (2)以多向量处理器部件为基础的结构; (3)以阵列处理器为基础的结构; (4)以处理(计算)单元阵列为基础的结构。 当时,我们认为(1)和(3)两种结构面临的问题与现有的MPP相似,主要技术壁垒在于如何提高计算资源的使用效率,在当前程序设计模式下,要攻克这个壁垒是比较困难的。我们在结构(2)和(4)方面做了更为前沿的探索,资料表明,这种探索的结果是有吸引力的。国防科技大学计算机学院研制的银河-Ⅰ和银河-Ⅱ巨型计算机,都采用了向量处理器的结构,在向量计算机系统研究和应用程序向量化等关键技术方面都有比较好的技术积累,同时对向量处理技术中存在的难点问题也有更加深刻的体会。我们课题组在讨论了学术新颖性和研究复杂性后,选择了结构(4)作为研究重点,而作为重点研究的方向则慎重地选择了以处理单元阵列为基础的新型计算模型——流计算模型。 美国斯坦福大学Imagine原型系统是以流计算模型为基础的流处理器经典代表。Imagine在处理器的适用性、功耗、程序效率、单位成本等因素上做了很好的权衡,其公布的研究成果非常有吸引力,鼓励我们更加深入地开展流体系结构的研究。2004年,我们申请了自然科学基金,得到2005年度探索项目的资助。在此期间,我们不但阅读了能够得到的所有资料,研究了流处理器的体系结构和程序设计工具链,而且启动了一个基于FPGA的32位流处理器验证系统的设计,该处理器被命名为“MASA”(Multi-dimension Adaptive Stream Architecture)。我们同时启动了MASA模拟器的设计和实现以及配套工具链的构造,并将课题组命名为“MASA课题组”。到2005年秋,我们课题组成功地在Altera的StratixII EP2S180上实现了一个完整的32位MASA处理器演示原型MASA-Ⅰ,其清晰的结构和主要测试结果与当初的模拟结果非常接近。
内容概要
本书介绍了一种新型的非冯•诺依曼体系结构——流体系结构。作者在前人的研究基础上,结合自己多年科研工作的体会,介绍了流处理的主要思想、流体系结构及其运行机制、编程模型及编译器设计,以JPEG和H264等典型应用为例详述了应用的流化方法;并叙述了多核流体系结构设计、程序设计与编译、VLSI特性等多个方面的内容;最后就流体系结构的未来发展进行了讨论。本书在介绍流体系结构这一专业领域的知识和技术时,秉承实事求是的科研精神,力求做到由浅入深、文字流畅、便于阅读。 本书可作为从事处理器体系结构设计与开发的科研人员和广大爱好者的参考书,也可作为大专院校计算机相关专业本科生、研究生的教材或参考书。
书籍目录
第1章 绪论 1.1 VLSI技术的发展对处理器体系结构的影响 1.2 应用对体系结构提出的新要求 1.3 高性能体系结构面临新的挑战 1.3.1 专用处理器 1.3.2 通用微处理器 1.3.3 DSP与可编程的媒体处理器 1.4 新兴的流处理器 1.4.1 Imagine和Merrimac 1.4.2 CELL处理器 1.4.3 基于片上存储的VIRAM体系结构 1.4.4 片内多处理机体系结构的代表:RAW和TRIPS 1.4.5 流计算模型SCORE 1.4.6 新型流体系结构小结第2章 流处理 2.1 流处理思想 2.2 硬件结构模型 2.2.1 解耦合计算和访存 2.2.2 多级存储层次 2.3 流处理实例及与向量处理的比较 2.4 小结第3章 流处理器微体系结构 3.1 流体系结构设计思想 3.1.1 控制子系统 3.1.2 存储子系统 3.1.3 计算子系统 3.1.4 对外接口 3.2 流处理器的指令集设计技术 3.2.1 流级指令 3.2.2 kernel级指令 3.3 流处理器的流水线设计技术 3.3.1 核心指令执行流水线的组织结构 3.3.2 流数据访问流水线的组织结构 3.3.3 流水线的数据通路及其相关处理 3.4 流处理器计算子系统的设计 3.4.1 簇内寄存器文件系统 3.4.2 簇内交叉互连开关 3.4.3 运算单元ALU和DSQ 3.4.4 计算簇内便笺存储器设计 3.4.5 计算簇间的通信单元设计 3.4.6 流IO单元设计 3.5 流处理器控制子系统的设计 3.5.1 核心指令控制逻辑 3.5.2 流指令控制逻辑 3.5.3 标量处理器核的控制逻辑 3.6 流处理器存储子系统的设计 3.6.1 流寄存器文件 3.6.2 Cache 3.6.3 DRAM存储器 3.7 流处理器核对外接口的设计 3.7.1 与标量处理器核的接口 3.7.2 多片流处理器核互连接口 3.7.3 片上总线接口 3.8 提高性能的优化设计讨论 ……第4章 流处理器协同机制 第5章 流编程模型与编译器第6章 流应用与编程 第7章 多核流处理器设计第8章 未来流处理器研究参考文献缩略语表
章节摘录
第2章 流处理 流处理器体系结构是一个新兴的体系结构概念,要理解它就必须从流模型、流处理等基本思想入手。本章从概述的角度出发,主要介绍一些基本的概念思想,以及基于流处理的硬件结构模型。此外,因为流处理是从向量技术发展而来的,所以本章最后还以实例说明了二者的区别。 2.1 流处理思想 流,是不间断的、连续的、移动的记录队列,队列长度可以是定长或不定长的。流记录的组成可以复杂或简单,如一个三角形的顶点、一幅图像的8×8的像素区域、一个简单的整数等。流处理就是针对流应用的上述特征进行的特殊处理,其本质思想可归纳为以下几点。 1.计算过程的分解 计算过程的分解是指人为地将一个应用分解成一系列的计算核心程序(kernel),产生数据流图,形成明确的生产者一消费者模型。基本上是根据功能来划分核心程序,每个核心都有明确的输入流和输出流。
图书封面
评论、评分、阅读与下载