出版时间:2012-2 出版社:高等教育出版社 作者:胡亮,徐高潮,魏晓辉 著 页数:479
内容概要
《现代信息科学与技术基础:分布计算系统(第3版)》主要介绍分布计算系统的结构和实现技术。《现代信息科学与技术基础:分布计算系统(第3版)》共分14章,主要讲述分布计算系统的基本概念、体系结构及重点设计问题,命名系统,通信,安全和保护,同步和并发控制,容错,多副本数据管理,资源管理与调度,分布式文件系统,分布式共享存储器,分布式程序设计语言,集群系统,网格系统,云计算系统等。
本书可作为高等院校本科高年级学生和研究生参考教材,也可供有关科技人员参考。
作者简介
胡亮,教授,博士生导师,现任吉林大学计算机科学与技术学院、软件学院院长,入选教育部新世纪优秀人才。主持国家、省部级科研项目25项,发表学术论文200余篇,出版著作2部。研究方向为分布式系统、集群计算与云计算。
徐高,潮教授,博士生导师,吉林大学计算机科学与技术学院。曾在香港城市大学任高级副研究员。主持或参加国家、省部级科研项目15项,发表学术论文50余篇,合作出版著作2部。主要研究方向为计算机网络和分布式系统。
书籍目录
第一章 绪论
1.1 促进分布计算系统发展的技术因素
1.2 分布计算系统的相关概念
1.2.1 分布计算系统
1.2.2 松散耦合和紧密耦合分布计算系统
1.2.3 同构型与异构型分布计算系统
1.3 分布计算系统的优点与新问题
1.3.1 分布计算系统的优点
1.3.2 分布计算系统的新问题
1.4 分布计算系统的透明性
1.4.1 透明性的概念
1.4.2 影响透明性的因素
1.5 分布计算系统与计算机网络系统
1.5.1 网络操作系统与分布式操作系统
1.5.2 计算机网络系统与分布计算系统的区别
1.6 分布计算系统的体系结构与设计问题
1.6.1 分布计算系统的分层体系结构
1.6.2 分布计算系统的组成
1.6.3 基于中间件的分布计算系统
1.6.4 分布计算系统的设计问题
习题
参考文献
第二章 命名系统
2.1 命名系统的结构与功能
2.1.1 命名系统的结构
2.1.2 命名系统的功能
2.2 分布计算系统中的命名
2.2.1 名字、地址和标识符
2.2 2分布计算系统中的命名要求
2.2.3 名字的结构
2.3 名字空间与名字解析
2.3.1 名字空间
2.3.2 名字解析
2.3.3 名字空间的合并
2.4 大规模分布计算系统中名字空间的实现
2.4.1 大规模分布计算系统中名字空间的组织方式
2.4.2 大规模分布计算系统中的名字懈析
2.5 命名系统实例——DNS
习题
参考文献
第三章 通信
3.1 通信的层次模型
3.1.1 ISOOSURM通信模型
3.1.2 TCP/IP通信模型
3.1 3分布计算系统的通信模型
3.2 通信类型
3.2 1报文传递
3.2.2 远程过程调用
3.2.3 报文传递实例1——aocket进程通信
3.2.4 报文传递实例2——MPI进程通信
3.2.5 RPC实例——SunRPC
3.3 组通信
3.3.1 组通信的概念
3.3.2 组通信的设计问题
2.3.3 ISIS中的组通信
习题
参考文献
第四章 安全和保护
4.1 加密技术
4.1.1 传统加密方法
4.1 2公开密钥加密方法
4.2 身份认证
……
第五章 同步和并发控制
第六章 容错
第七章 多融本数据管理
第八章 资源管理与调度
第九章 分布式文件系统
第十章 分布式共享存储器
第十一章 分布式程序设计语言
第十二章 集群系统
第十三章 网格计算系统
第十四章 云计算系统
章节摘录
版权页: 插图: 第六章容 错 分布计算系统区别于单机系统的一个特点是在分布式系统中存在着部分失效的情况。当分布式系统某个部件出现问题的时候就发生了部分失效。虽然部分失效对分布式系统的性能有一定的影响,但同时,它应该不会影响分布式系统中整个应用程序的正确执行。相反,在单机系统中,如果系统中的一个关键部件出现问题,则整个应用程序就无法继续执行。 分布计算系统的一个重要设计目标是当系统中出现部分失效的时候,系统应该能自动从失效中恢复过来,并且不会对整个系统的性能产生严重的影响。在本章里,我们要讨论分布计算系统中的容错技术。 6.1 基本概念 容错是计算机科学中一个重要的研究领域。本节我们首先介绍与故障处理有关的一些基本概念和分布计算系统中的故障模型。关于分布计算系统中容错的一些非常有用而详细的介绍可以参见文献。 6.1.1 可信系统 分布计算系统应该是一个可信系统(Dependable System),容错是与可信系统紧密相联系的一个概念。分布计算系统的可信性(Dependability)包括如下几个方面。 (1)可用性(Availability)。可用性反映的是系统随时可被用户使用的特性。也就是说,在任何给定的时刻用户都可以使用此系统正确地执行给定的任务。 (2)可靠性(Reliability)。可靠性指的是在错误存在的情况下,系统持续服务的能力。尽管可靠性和可用性容易混淆,但它们并不是同一个概念。可靠性反映的是一段时间的特性,而可用性反映的是某个时刻的特性。高可靠性系统能够持续运行一个相当长的时间而不会中断。如果一个系统,每个小时都有并且仅有1ms时间失效,那么它的可用性可达99.9999%,但是它仍然是一个高度不可靠的系统。同样,如果一个系统从来不崩溃,但是在8月份中,有两个星期的假期需要关机,这个系统是高可靠性的系统,但是它的可用性只有96%。 (3)安全性(Safety)。安全性指的是在系统出现暂时错误的情况下,不出现灾难性后果的能力。例如,核电厂的控制系统和宇宙飞船的控制系统要求具有很高的安全性。 (4)可维护性(Maintainability)。可维护性,指的是系统一旦出现故障,系统易于修复的能力。高可维护性的系统意味着具有高的可用性。对于高可维护性系统来说,要求它具有自动检测错误和自动修复的能力。 (5)保密性(Security)。保密性要求系统资源不被非法用户访问。这方面的内容已经在第四章中作了介绍。 下面再介绍一下系统失效和错误。 系统失效指的是系统不能提供它所固有的服务功能。例如,分布式系统是为用户提供一系列服务的,但其中某一个服务或某些服务功能不能完全正确提供时,就说系统失效了。 一般来说,从错误的时间特性来看,错误可分为暂时性的(Transient)、间歇性的(Intermittent)和永久性的(Permanent)。暂时性的错误一旦发生之后就会消失,当相关的操作重复执行之后,错误就消失了。间歇性的错误是一会出现,一会又消失的错误,这种错误十分令人烦恼,因为它十分难于诊断。永久性错误是一种持续性错误,这种错误一旦出现,将会长时间存在,直到出现错误的部件被修复为止。像集成芯片被烧坏、软件缺陷、磁盘磁头损坏等都是永久性错误。
编辑推荐
《分布计算系统(第3版)》可作为高等院校本科高年级学生和研究生参考教材,也可供有关科技人员参考。
图书封面
评论、评分、阅读与下载