出版时间:2010-1 出版社:高等教育出版社 作者:曾宇 页数:274
前言
在过去10年,高性能计算越来越得到产业界认可,应用领域正从科学计算领域向商业计算、信息化建设领域拓展,应用的种类不断增多,普及程度逐渐深入,使用者也从专家型研究人员向普通用户拓展。当前,内存墙、I/O墙、功耗墙、复杂性墙、编程墙、扩展性墙是高性能计算机发展及应用的主要瓶颈。以高性能、可编程、可移植、稳定性为特征的高效能技术是高性能计算机研究的新方向。在高效能、多核、虚拟化等诸多技术的推动下,由超级计算拓展到广域计算机基础设施的科学研究正处于鼎盛阶段,一场在全球范围内的高性能计算平民化运动正在拉开惟幕,我们也称之为“泛高性能计算时代”。本书对大规模高性能计算机如何降低能耗、提升效能以及减少管理的复杂度等关键技术进行了阐述。第1章为引言。第2章介绍了一种基于遗传算法的功耗管理方法,该方法采用作业队列的能效比作为调度因素,与面向资源效率的传统作业调度算法相比,在确保提升资源利用率、减少资源碎片、提升作业吞吐率、减少饥饿作业的前提下,大幅提升了系统的能效比。实际应用测试表明,该方法能有效降低系统能耗。第3章设计了一种分布式层次化的自主管理机制,该机制中采用的触发式Bully选举算法具有较高的执行效率,并能够适应节点故障、链路故障和节点变化等情况,具有一定的容错能力和动态特性。该机制支持在不停机条件下新增设备、修改特征参数,支持引入新的规则和进行启发式推理,从而提高了管理效率和故障定位的准确性。
内容概要
本书对大规模高性能计算机如何降低能耗、提升效能并减少管理的复杂度等若干关键技术进行了阐述,主要内容包括:自适应功耗管理技术、自主管理技术、应用加速技术、高密度节点技术、网络内存技术、事件流应用技术、并行模拟技术等,并介绍了并行模拟引擎SimK的设计与实现,最后给出了高效能计算机曙光5000A的相对效能评价结果。 本书可供从事高性能计算机研究及应用的科研人员使用,也可作为高年级本科生及研究生学习高性能计算相关课程的参考书。
作者简介
曾宇,博士,高级工程师,中国科学院计算技术研究所研究生导师,北京市计算中心主任,从事研究领域包括体系结构、高性能计算机等。先后主持1O余项国家级高性能计算机领域重大研发及产业化项目。作为曙光系列高性能计算机的主要研制者,先后主持或参与研制曙光4000、曙光5000、曙光刀片服务器、曙光个人HPC等系列国产高性能计算机系统。
书籍目录
第1章 引言 1.1 高性能计算机的应用 1.2 高效能计算机的技术挑战 1.3 高效能计算机 1.4 本书的组织第2章 自适应功耗管理技术 2.1 概述 2.2 相关研究 2.2.1 CPU功耗控制 2.2.2 CPU工作频率控制策略 2.2.3 冷却技术 2.2.4 系统级节能技术 2.3 自适应功耗管理 2.3.1 框架结构 2.3.2 基于自适应功耗管理的作业调度 2.3.3 性能评测 2.4 机群功耗管理软件的实现 2.4.1 软件流程 2.4.2 功耗限制 2.4.3 节点任务调度 2.5 应用效果 2.6 小结第3章 自主管理技术 3.1 概述 3.2 相关研究 3.2.1 自主计算模型 3.2.2 自主计算体系结构 3.2.3 自主元素 3.2.4 自主计算系统 ……第4章 应用加速技术第5章 高密度节点技术第6章 网络内存技术第7章 事件流应用技术第8章 并行模拟技术第9章 并行模拟引擎Simk第10章 曙光5000A的实现与评价参考文献
章节摘录
插图:本书从高效能计算机若干关键技术的研究与实现出发,第1章概述了高性能计算机的发展历程及趋势,阐述了当前基于机群架构实现千万亿次扩展面临的主要技术瓶颈,指出高效能是未来高性能计算机的发展方向。第2章描述了自适应功耗管理技术,详细阐述了基于遗传算法的功耗调度策略。在第3章中,基于高效能计算机管理的复杂性问题,分析研究了层次化自主管理技术。在第4章中着重研究应用加速器技术,基于网络安全应用,分别从CBF HASH算法、数据预处理、五元组过滤等几个方面详细介绍了网络应用加速器的设计及实现技术,并同时介绍了BLAS加速的设计,对其Linpack加速效果做了分析。第5章介绍了基于刀片结构的曙光5000A高效能计算节点的设计及实现。第6章通过对计算机系统内存资源进行虚拟化和网格化,实现了一个网络内存系统,并通过多个应用对其使用效果进行了验证。第7章着重介绍了事件流相关技术研究及事件流应用技术,基于网络监控系统对事件流的查询特性及查询调度进行分析,并设计实现了一个并行查询引擎。第8章着重介绍了并行模拟及并行模拟器的相关技术,提出了基于阻塞/唤醒机制的同步策略、无锁调度和通信机制,以及线程安全的缓冲区管理等方法。第9章着重介绍了并行模拟引擎SimK的设计与实现。第10章概述了曙光5000A系统的实现及评价,包括总体架构、硬件及软件架构,提出了高性能计算机相对效能评价指标RPI(Relative Producfivity Indicator)。
编辑推荐
《高效能计算机系统:若干关键技术分析》是由国家科学技术学术著作出版基金资助。
图书封面
评论、评分、阅读与下载