高等计算机体系结构第1章

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1高等计算机系统结构主讲任国林2一、课程目标1.并行性理论的研究并行计算机系统结构与系统模型;通信系统模型及编程模型;并行计算机性能评价方法;可扩展性原理及方法。2.并行技术和可扩展系统结构的研究微处理器并行技术;分布式存储器和时延容忍技术;互连网络技术;可扩展多处理器。3二、参考教材1、并行计算机系统结构,DavidE.Culler等著,李晓明等译,机械工业出版社,2003.12、可扩展并行计算—技术、结构与编程,黄铠、徐志伟著,陆鑫达等译,机械工业出版社,2000.53、计算机系统结构(第二版),郑纬民、汤志忠著,清华大学出版社,1998.94、高等计算机系统结构,黄铠著,王鼎兴等译,清华大学出版社,2001.115、计算机系统结构—一种定量的方法(第二版),JohnL.Hennessy等著,郑纬民等译,清华大学出版社,2002.84第一章并行计算机系统结构概述5第一节计算机系统结构概念一、计算机系统结构概念1、计算机系统层次结构应用语言级高级语言级汇编语言级操作系统级传统机器级微程序机器级电子线路L5虚拟机L4虚拟机L3虚拟机L2虚拟机翻译(应用程序包)翻译(编译程序)翻译(汇编程序)软硬件交界面物理机器解释硬件直接执行硬件固件系统软件虚拟机器实际机器应用软件部分解释62、计算机系统设计方法(1)由上向下从软件到硬件,适合专用机的设计。(2)由下向上从硬件到软件,适合通用机的设计。两种方法结果:形成软、硬脱节。(3)从中间开始从软、硬件交界面开始设计。要求不断进行优化设计→交互、评价的工具和方法。73、系统结构定义精确定义:机器语言程序员、编译程序编写者所看到的计算机的结构和功能特性。系统结构含义:实际上是研究计算机系统中软、硬件之间的界面定义及其上下的功能分配。基本定义:程序员所看到的计算机的属性。系统结构、计算机组成、物理实现三者关系:1:n1:n系统结构-----计算机组成-----物理实现83、系统结构包含内容数据表示、寻址方式、指令系统、寄存器组织、存储系统、中断机构、I/O结构、机器工作状态定义和切换、信息保护;计算机组成包含内容(不属于系统结构内容):数据通路宽度、专用部件设计、各种OS共享程度、功能部件并行度、控制机构组成方式、排队与缓冲技术、预估与预判技术、可靠性技术等。94、计算机系统结构设计系统结构设计步骤:a.需求分析--主要在应用环境、所用语言的种类及特性、对OS的特殊要求、所用外设特性、技术经济指标、市场分析等方面;b.需求说明--主要包括设计准则、功能说明、器件性能说明等;c.概念性设计--进行软、硬件功能分析,确定机器级界面;d.具体设计--机器级界面各方面的确切定义,可考虑几种方案;e.优化--反复进行优化设计及性能评价。105、并行体系结构并行计算机是一组相互通信、相互协作以快速求解大型问题的处理单元。并行体系结构:由宏体系结构、微体系结构两部分组成。微体系结构:围绕处理器及它的壳;宏体系结构:并行计算机系统的整体结构。并行体系结构研究重点:并行性:算法、通信、互连存储系统:速度、数据一致性可扩展性:性能评价、加速比11二、计算机系统结构分类1、Flynn分类法思路:按指令流和数据流的多倍性进行分类。类型:SISD,SIMD,MISD,MIMD四种。从MIMD到SISD性能逐步下降。缺点:对流水线处理机的分类不明确。122、Handler分类法思路:在系统中三个层次上按并行程度及流水线处理程度分类。层次:PCU(处理控制器器或宏流水)K级ALU(算逻部件或指令流水)D级BLC(位级电路或操作流水)W级分类:T(C)=〈K×K’,D×D’,W×W’〉K为PCU数、K’为可组成流水的PCU数,D为每个PCU中ALU数、D’为可组成流水的ALU数,W为ALU或PE字长,W’为所有ALU或单PE流水线段数。各层次的数值越大越好。133、冯氏分类法思路:按照系统的最大并行程度进行分类。最大并行度:单位时间内能处理的最大二进制位数。即:Pm=位片宽×字宽位片宽字宽SISDSIMD(MPP)SIMDMIMD1mn1m’n’最大并行度的数值越大越好。144、按控制方式分类类型:(4种)控制流方式:顺序执行(冯·诺依曼型)数据流方式:操作数到位即可运算,无序执行↓规约方式:驱动方式与数据流相反,无序执行↑匹配方式:非数值型应用,主要对象为符号。对不同类型结构,并行程度越大越好。15三、影响计算机系统结构发展因素1、软件对系统结构发展的影响(1)系列机思想:具有相同系统结构或对原系统结构进行扩充,不同组成或实现技术,来实现软件可移植性。影响一:使得新的组成与实现技术很快得到应用,大量的兼容产品出现,推动了系统结构的发展。软件兼容种类:向上/向下兼容、向前/向后兼容。系列机要求:保证向后兼容,力争向上兼容。时间机器档次当前机器向上兼容向下兼容高低向后兼容向前兼容16影响二:为保持软件兼容性,系列机要求系统结构基本不变,又限制了系统结构的发展。(2)模拟与仿真模拟:用机器语言解释实现软件移植。同时模拟机器语言、存储系统、I/O系统、控制台操作及形成虚拟操作系统。仿真:用微程序直接解释另一种指令系统。同时还需解释操作系统、I/O系统的操作。异同:解释程序存放位置、是否有硬件参与方面异。除指令系统外,要解释操作系统、存储系统、I/O系统等方面同。17(3)统一高级语言方法存在一定的困难,争取汇编语言或机器语言的统一。导致开放系统(具有可移植性、交互操作性)的出现,用硬件抽象层技术适应不同的硬件平台。2、应用对系统结构发展的影响应用要求:高速度、大容量、大吞吐率大、巨型机趋势:研究新系统结构、组成技术,并推广,向通用结构发展;中、小、微型机趋势:保持价格基本不变,提高性能;保持性能基本不变,降低价格。183、技术对系统结构发展的影响器件的性能、使用方法改变、影响系统结构及组成方法。器件发展过程:通用片→现场片→半用户片→用户片。影响:器件的发展推动系统结构与组成技术的发展,同样系统结构的发展要求器件不断发展。原因:新结构的使用,取决于器件发展能否提供可能;器件性能/价格提高,使新结构、组成下移速度更快;器件的发展,推动算法、语言的发展;器件的发展,改变了逻辑设计方法。19第二节系统设计的定量原理一、大概率事件优先原则基本思想:对大概率事件赋予它优先的处理权和资源使用权,以获得全局的最优结果。该原则是系统设计中最重要和最常用的原则。二、Amdahl定律基本思想:系统中对某部件采用某种更快执行方式,所获得的系统性能的改变程度,取决于这种方式被使用的频率,或所占总执行时间的比例。erefeefTTpS)1(10应用:使用该定律可改善“系统瓶颈”性能。20例:某功能处理时间为系统原来时间的40%,将其处理速度加快10倍后,整个系统性能提高多少?已知:fe=0.4,re=10,利用Amdahl定律,则Sp=1.56re=10时Sp和fe的关系如下图:0.00.51.0feSp10015结论:改善某部件性能后,系统性能急剧提高,则该部件为“系统瓶颈”。21三、程序访问的局部性原理基本思想:程序执行中呈现出频繁重复使用那些最近已使用过的数据和指令的规律,规律指时间局部性和空间局部性。时间局部性:近期被访问的信息,可能马上被访问;空间局部性:与被访问地址相邻的地址上的信息可能会一起被访问。应用:层次存储体系设计。四、软硬件取舍原则1.在现有软硬件条件下,所选方法使系统有高的性能/价格;2.所选方法尽量不限制计算机组成和实现技术;3.进行选择时,把如何为编译和操作系统的实现提供好的支持放在首位。22第三节计算机系统性能评价一、计算机系统性能指标计算机性能:正确性、可靠性和工作能力。评价性能:仅指工作能力。性能分为峰值性能和持续性能,着重评价持续性能。工作能力指标:处理能力—单位时间内能处理的信息量(吞吐率);响应能力—响应时间、周转时间、排队时间;利用率—T时间内,某部分被使用时间t与T的比值。23二、系统处理能力1、MIPS指标指令除包含运算指令外,还包含取数、存数、转移等指令在内。MIPS反映处理能力不够精确(问题-指令功能等)。MIPS只适宜于评估标量机。评价方法:相对MIPS--指相对参照机而言的MIPS:fTTTMIPSMIPSvfReRe通常用VAX-11/780机处理能力为1MIPS。242、MFLOPS指标能够精确反映处理能力(问题-浮点运算)。MIPS比较适宜于评估向量处理机。不同操作难度处理:通过正则化方法关联不同的操作。MIPS与MFLOPS关系:1MFLOPS≈3MIPS。253、吞吐率指标定义:单位时间内能处理的作业数。应用:用于表示并行计算机的并行处理能力的速度。对单处理器系统,吞吐率=1/执行时间。提高吞吐率指标方法:流水化:使多个作业流水处理;并行处理:进行作业分配,给每个PE分配一个作业。26三、系统响应能力响应能力:主要指系统响应时间(输入→输出时间)。对单机系统而言,通过响应时间表示。响应时间:一般只考虑CPU时间(用户CPU时间+系统CPU时间),进一步只衡量用户CPU时间。T=Tuseful+Tdatalocal对多处理机而言,通过执行时间表示。执行时间:需要考虑CPU时间(用户CPU时间)和通信时间。T=Tuseful(n)+Tdatalocal+Th=Tuseful/n+Tdatalocal+(Tsynch+Tdataremote+Toverhead)271、用户CPU时间TCPU=IN×CPI×TC=IN×(p+m×k)×TC影响用户CPU时间的因素:系统属性性能因子IN平均CPITCpmk指令系统结构××编译技术×××PE实现与控制技术××Cache和内存层次结构××282、平均CPI)(1)(1niIIiIICPINiNniiiCPICPIn:指令种类数,CPIi:第i种指令的CPI,Ii:第i种指令使用的数量如何提高系统性能?减小平均CPI↓减小频繁使用(Ii/IN较大)指令的CPIi↑大概率事件优先原则的应用29例:A机执行的程序中有20%转移指令(2TC),转移指令都需要一条比较指令(1TC)配合,其他指令1TC。B机中转移指令包含比较指令,但TC比A机慢15%。A机、B机哪个工作速度快?A机:TCPUA=INA×(0.2×2+0.2×1+0.6×1)×TCA=1.2INA×TCAB机:TCPUB=0.8INA×((0.2/0.8)×2+(1-0.2/0.8)×1)×1.15TCA=1.15INA×TCA结果:B机比A机工作速度快。注意:不能仅按主频衡量系统性能。30四、利用率不直接表示系统性能指标,与前两种指标有密切关系。对系统性能或结构改进与优化起着至关重要的作用。例:流水线的采用;Cache的作用;I/O通道的设计。(定量设计相关原理)31五、可扩展性通过性能可伸缩性评价并行处理能力。),(),()1,(),(nphnpTpTnpSh:通信时间,P:问题规模,n处理器数量。衡量方法:测量不同n时的加速比,构成性能可伸缩性曲线。性能可伸缩性:系统性能加速比随处理器数n增加而线性增长,即S=k×n。影响因素:结构、处理器数量、问题规模、存储系统等。32六、性能评价与比较1、评价技术(1)分析技术思路:在一定假设条件下,计算机系统参数与性能指标参数之间存在着某种函数关系,按其工作负载的驱动条件列出方程,用数学方法求解。发展:从脱离实际的假设发展到近似求解。近似求解算法:聚合法、均值分析法、扩散法等。33(2)模拟技术思路:建立模拟器,模拟系统性能模型和工作负载模型,对运行后的数据进行统计分析。方法:按被评价系统的运行特性建立系统模型;按系统可能有的工作负载特性建立工作负载模型;用语言编写模拟程序,模仿被评价系统的运行;设计模拟实验,依照评价目标,选择与目标有关因素,得出实验值,再进行统计、分析。34(3)测量技术思路:通常采用基准测试程序评估。基准测试程序:分为宏基准测试程序和微基准测试程序。宏基准测试程序:测量系统总体性能,

1 / 41
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功