1.2什么是分布式计算系统?它的实质是什么?分布式计算系统是由多个相互连接的计算机组成的一个整体,这些计算机在一组系统软件(分布式操作系统或中间件)环境下,合作执行一个共同的或不同的任务,最少依赖于集中的控制过程、数据和硬件。实质:分布计算系统=分布式硬件+分布式控制+分布式数据。1.10多处理机与多计算机的区别是什么?同构多计算机和异构多计算机各有什么特点?区别:多计算机是将多个计算机联合起来处理问题,多处理机是在一个系统内集成多个处理器.广义上说,使用多台计算机协同工作来完成所要求的任务的计算机系统都是多处理机系统。即多计算机系统。狭义上说:多处理机系统的作用是利用系统内的多个CPU来并行执行用户的几个程序,以提高系统的吞吐量或用来进行冗余操作以提高系统的可靠性。同构计算机的特点:1.每个节点是一台计算机,包含CPU和存储器。2.节点间的通信量较少。3.同构计算机系统的互连有两种结构:基于总线的多计算机系统和基于交换的多计算机系统。异构计算机的特点:1.节点可能是多处理机系统、集群或并行高性能计算机。2.节点间通过互联网络如Internet连接起来的。3.有两种实现方法:采用分布式操作系统和中间件软件层。1.16什么是中间件,它的功能是什么?它在分布式系统中的地位是什么?中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源。中间件位于客户机/服务器的操作系统之上,管理计算机资源和网络通讯,是连接两个独立应用程序或独立系统的软件功能:命名服务作业调度高级通信服务资源管理数据持久化分布式事务分布式文档系统安全服务地位:中间件的一个重要目标是对应用程序隐藏底层平台的异构型,因此中间件系统都提供一组完整度不同的服务集。这些服务是通过中间件系统提供的接口来调用的。一般禁止跳过中间件层直接调用底层操作系统的服务。1.18分布式系统有哪些计算模式?(必考)1.面向对象模式2.面向服务模式3.公用计算模式4.志愿参与模式(详见书p21-p22页)2.5有哪些名字服务形式?名字服务器的组成与功能是什么?名字服务形式:(1)名字服务:名字服务是根据实体的名字查找它的属性(地址)。(2)目录服务:目录服务既可以根据实体的名字查找实体的属性,当不知道实体名时也可以根据实体的一个或多个属性及其值查找并得到一个匹配这些属性的实体列表。(3)合约服务:是一种增强的目录服务,通过技术规范来定位一个命名实体。名字服务器组成:(1)名字服务器操作:管理、查询操作和行政管理。增加、删除和修改上下文的目录项。访问优先权。(2)名字解析:根据名字解析请求,得到被解析对象地址。(3)缓存:缓存名字查询和解析的结果。(4)多副本管理:副本修改和副本一致性维护。(5)通信:客户端的名字代理通信和名字服务器之间(6)数据库:存放名字解析上下文或其子域。名字服务器功能:管理名字解析上下文、实现名字查询与解析和其它名字服务器通信协调。2.7什么是迭代名字解析,什么是递归名字解析,它们各有什么优缺点?迭代名字解析:建议考试画图解释:递归名字解析:也画图解释各自优缺点:递归名字解析缺点:要求每台名字服务器具有较高的性能。递归名字解析优点:1.递归名字解析过程中,各名字服务器解析的缓存结果使用更为高效。2.如果主机与服务器距离很远,那么采用递归名字解析将更为高效。迭代的优缺点与上面相反。2.14什么是目录服务?目录项和属性及属性值的关系是什么?目录服务:目录服务既可以根据实体的名字查找实体的属性,当不知道实体名时也可以根据实体的一个或多个属性及其值查找并得到一个匹配这些属性的实体列表。关系:目录项是一个命名对象的信息集合。每个命名对象包括若干个属性,每个属性有一个属性类型和相应的一个或多个属性值。2.18轻量数据访问协议LDAP和目录访问协议DAP的关系和区别是什么?1.LDAP的最初目标是向用户提供目录服务时避免DAP的大量开销。2.LDAP的操作集对DAP做了简化,删除了read和list操作,用search代替。3.DAP是目录用户代理(DUA)与目录系统代理(DSA)之间的请求/响应协议。LDAP是用户用来访问目录服务的一个协议。4.建议再回答下LDAP的模型:3.7什么是远程执行逻辑机模型?对逻辑机模型的要求是什么?概念:建议画图。要求:(1)远程进程必须能访问驻留在源计算机上的文件系统。(2)远程进程能接收逻辑机内任何进程发来的信号,也能将信号提供给逻辑机内任何进程。(3)进程组保持在逻辑机内。(4)基于树型的进程父子关系在逻辑机内必须得以保持。3.13何为异步进程迁移算法?何为同步进程迁移算法?它们的优缺点是什么?异步进程迁移算法:这类算法允许非迁移进程在迁移过程中继续运算,只有迁移进程被中断进行相关的操作。优点:可以得到较好的执行效率。缺点:和原有环境的兼容性不好,不能方便的移植。同步迁移算法:这类算法在迁移过程中所有进程(包括非迁移的协同进程)都被挂起,进程之间需要同步来清空通信信道中的中途消息,所有进程均要阻塞等待迁移事件完成后,才能从中断处继续运行。优点:算法简单,具有较好的可移植性和易于实现。缺点:需要中央控制管理进程参与,所有进程都被迫中断,等待迁移过程的结束。3.15比较进程远程执行与进程迁移两种机制。进程远程执行的要求:(1)寻找管理机制。(2)进程远程执行是透明的,应与位置无关。(3)主人优先原则进程的迁移可以支持:(1)动态系统管理与维护(2)动态负载平衡(loadbalancing),系统中重负载处理机转移一部分负载到轻负载的处理机上运行,使得整个集群系统中的所有处理机的负载趋向均衡,从而提高系统的整体运行效率。(3)系统容错(4)主人优先使用原则注:此题我未找到较好的答案。4.1在水平时间轴上表示阻塞发送/接收和非阻塞发送/接收进程与操作系统内核之间操作的时间关系。没有具体答案,先方便理解一下阻塞和非阻塞:阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.阻塞调用是指调用结果返回之前,当前线程会被挂起。调用线程只有在得到结果之后才会返回。非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程。例子:你打电话问书店老板有没有《分布式系统》这本书,你如果是阻塞式调用,你会一直把自己“挂起”,直到得到这本书有没有的结果,如果是非阻塞式调用,你不管老板有没有告诉你,你自己先一边去玩了,当然你也要偶尔过几分钟check一下老板有没有返回结果。这个图不知道对不对:4.2试叙述如何实现阻塞发送/接收和非阻塞发送/接收,对操作系统有什么要求?通过发送原语send和接收原语receive实现要求操作系统能实现4种不同的可靠性语义。至少一次:保证正确完成消息传送至少一次至多一次:保证正确完成消息传送至多一次。在没有节点崩溃和网络断开情况下,它只正确地执行一次消息传送。事务语义:它保证消息的原子性。不管节点崩溃或网络端口与否,它或者完成一次消息传送,或者什么也不做。精确一次:无论在什么情况下,保证正确完成一次消息传送,不管是否有节点崩溃或网络断开,它接近某种程度的容错机制。4.4对以下每个应用程序,你认为“至多一次”和“至少一次”语义哪个最好?(1)在文件服务器上读写文件:至少一次。(2)银行服务:至多一次(3)编译一个程序:至少一次4.9什么是因果定律?它和FIFO全定序相比,哪个更严格?因果定律:不管含有因果关系的消息是由同一个发送进程多播,还是不同发送进程多播,所有接收进程要保证先接收“因”消息,后接收“果”消息。FIFO:对同一个发送进程发出的多播消息,要求所有接收进程按发送的顺序接收,而对不同发送进程的多播消息可按不同顺序接收。相比之下,因果排序更严格。4.12RPC被认为是分布式最初的中间件,它能实现分布式系统的透明性吗?p92在RPC过程中,客户可以简单的忽略不关心的内容,客户并不直接执行send和receive原语,也不关心消息的传递,所有这些都隐藏在桩中,从而实现RPC的透明性。建议;本题虽然已完,但最好将RPC的基本操作看一遍。5.7Richart_Agrawala算法如何改进了Lamport算法,它的优点是什么?(必考)Lamport算法的开销是3(N-1)个消息,Richart算法只要2(N-1)个消息,N是竞争资源的进程数。Lamport算法前2步:1.Pi资源请求消息Request(Ti:Pi)发送2.Pj收到Request(Ti:Pi),按T顺序置于其消息队列,如果没有资源请求或请求时间晚于收到消息的时间戳,回应Reply(Tj:Pj)Richart算法前2步:1.Pi资源请求消息Request(Ti:Pi)发送2.Pj收到Request(Ti:Pi),按T顺序置于其消息队列如果没有资源请求或请求时间晚于收到消息的时间戳,回应Reply(Tj:Pj);否则推迟返回应答消息进程从临界区退出,向需要请请求资源的进程补发应答消息标红处即为改进优点:1.它具有对称性2.具有完全的分布式控制3.对通信链路相对速度的不敏感性5.8比较集中式算法、Ricart_Agrawala算法和令牌算法的开销和问题集中式算法的问题:容易出现单点故障Ricart算法的问题:由于不应答被认为是资源被占用,所以如果有某个节点故障,会导致该算法的异常终止。同时各进程对资源的使用情况缺乏了解。令牌算法的问题:检测令牌丢失困难开销:集中式算法开销最大,Richar算法需要2(N-1)个消息,令牌算法最多需要N-1个消息。5.11共享K个相同资源的互斥算法和Ricart_Agrawala算法的共同点和区别是什么?相同点:基于相同的概念,每个竞争进程都维持一个推迟应答数组RD[],数组元素是表示相应进程是否推迟发出应答消息。区别:1.应答消息到达的环境。在Ricart算法中,正在等待进入临界区的进程要得到N-1个应答消息。在共享K个相同资源的互斥算法中,N-K个应答消息是在进程等待时到达,K-1个消息是进程已在临界区或等待进入临界区或离开临界区后到达。2.在Ricart算法中,其他竞争进程推迟应答数组的每一项RD[i]是布尔型,因为应答只能是一个,或是推迟,或是不推迟。在共享K个相同资源的互斥算法中,可能有多个应答消息被推迟,这样RD[i]应声明为整数型。5.13在基于事件优先权算法中,如何保证低优先权的进程有机会进入临界区,而不挨饿。没找到答案,不敢乱写。8.2图8.1(b)为什么违背严格一致性?因为B读到的不是a,而是数据项x的初值null,客户A的写操作没有立即传播到B,未能及时完成对副本的修改。8.3图8.2(b)为什么违背顺序一致性?因为进程C看到数据项x是先写a后写b,而进程D看到数据项x是先写b后写a。8.4图8.3(c)为什么符合因果一致性定律?因为W(x)a和W(x)b是并发写,因此也符合因果一致性要求。8.5图8.4(b)为什么遵循因果一致性,但对FIFO一致性是无效的?看了半天暂时还不会,但是书p200-p205的几种一致性必须弄懂,是必考的。8.7比较“传播更新通知”、“传播更新数据”和“传播更新操作”和它们的应用场合传播更新通知:只传播一个简短的数据通知,不包含其他信息。写操作对读操作的比率很高时,传播效果好。传播更新数据:在副本间传送被修改过的数据。读操作对写操作的比率很高时,传播效果好。传播更新操作:不传播被修改过的数据,而是告诉各副本应该执行的操作。要求每个副本有一个进程来执行更新操作,主动的保持各副本关联数据的一致性。应用场合:传播更新通知:无效化协议传播更新数据:读操作对写操作的比率很高时传播更新操作:主动复制8.9一个文件被复制在10个服务器上,列出表决算法的“读集团”和“写集团”。这是12个服务器是的例子:此算法要求N(R)+N(W)NN(W)N/2此题的N=10;那么写集团可以为678910相应的读集团为5678910(NW=6)45678910(NW=7)以此类推。8.14在基于页面的DSM中如何维护副本拥有者和副本集这类控制信息?拥有4种算法:集中管理算法固