第1页/共17页第二章APZ部分(CP/RP)一、CP的发展历史及性能比较图1.1CP的种类和发展历史如上图,CP的最早版本是APZ210系列,随着用户数的增加,为了提高处理能力,演变出APZ211、APZ212和APZ213三个系列。其中APZ212系列是我们最熟悉和最常见的,也是现在使用最多的,其他几个系列在中国已经接近淘汰了。各版本的CP(部分)性能比较如下表:APZ版本相对速度210031211021.321110,21111421201,21202621210,2121112212205021225202123020021233300广东省目前最常用的CP是APZ21230和APZ21233这两个类型,光从处理能力来看,30的CP能够处理的用户数是30-40万左右,而33的处理能力大概是30的1.5~1.8倍左右。下面介绍CP的功能和结构的时候,主要就以这两种为例。二、CP的硬件结构第2页/共17页111、、、AAAPPPZZZ222111222333000///333333的的的实实实物物物面面面板板板图图图APZ21230/33A面CP实物图APZ21230/33B面CP实物图APZ21230/33B面CP的面板示意图第3页/共17页222、、、CCCPPPUUU面面面板板板的的的各各各PPPCCCBBB介介介绍绍绍•POU-C:电源模块•SPU(SignalProcessorUnit):和RP通信,把来自RP的任务按优先级放到不同的缓冲区,并为IPU准备任务•IPU:InstructionProcessorUnit(指令处理单元)•STUD:内存板,有DRAM和SRAM,由IPU操作•MAU:自动维护单元,只有B边有•POWC:包括如下功能a、ErrorregistrationanderrorsignalingtoMAUb、CPUworkstatelogicc、Clockgenerationandclockswitchingfuctiond、LogicforsendingCPTsignalsbetweenSPUandMAUe、InterfaceforreadingPCBboardsID(self-identifyinghardware)f、InterfacelogicforMIAindicationg、Supervisionoffansandpower333、、、AAAPPPZZZ222111222333000///333333的的的硬硬硬件件件功功功能能能块块块APZ212的功能块示意图APZ21230/33主要包括如下几个硬件功能块:(1)、CPU(TheCentralProcessorUnit),包括IPU(InstructionProcessorUnit)和SPU(SignallingProcessorUnit)。SPU又由两部分组成:主SPU和从SPU,主要负责作业的调度和管理;而IPU则负责作业的执行。PS(PROGRAMSTORE,程序存储)和RS(REFERENCESTORE,参考存储)的物理实现是通过IPU来完成的。第4页/共17页CPU的主要工作流程如下:A、SPUreceivesasignal(job)fromRPHorIPU.B、WhenthetimecomesIPUwillfetchthejobfromajobbufferinSPU.C、IPUfetchesstartaddresseslocatedinRSfortheprogramsequencetobeexecutedinPSandcorrespondingdatalocatedinDS.D、IPUfetchesandexecutesprogramsequenceinstructions.ThedataarefetchedfromDS.E、TheresultoftheprogramexecutionisfetchedbySPU.Theresultmightbeanotherjobtobeexecuted.(2)、TheStorageUnitData(STUD)containstheDataStore(DS).(3)、TheDisplayandPowerController(DPC),主要目的是监视电源。(4)、TheRegionalProcessorHandler(RPH),连接RPBUS到CP上,当需要使用不同数量的RP时可以采用不同的硬件配置。可以分别连接串行RP和并行RP,也可以同时连接串行RP和并行RP。(5)、TheMaintenanceUnit(MAU),主要目的是监视CP的状态,并作为CP跟CPT系统的接口存在,同时监视用于冷却CP的风扇的状态。(6)、TheMaintenanceUnitInterface(MAI)andPowerControlUnit(POWC)。上面的硬件模块中,CPU、STUD、DPC、MAI和POWC都属于CPS系统,RPH属于RPS子系统,MAU属于MAS子系统。444、、、AAAPPPZZZ222111222333000///333333的的的总总总线线线APZ21230/33的总线示意图(1)、RPHB(RPHANDLERBUS)SPU通过RPHB跟RPH相连,从而控制RP,RPH是RP跟CP之间的接口。第5页/共17页(2)、UMB(UpdatingandMatchingBus)更新比较总线,Ex侧传送数据到SB侧以比较两侧数据或更新SB侧。这种总线位于机框的背面,连接两侧CP的IPU和SPU。(3)、AMB(AutomaticMaintenanceBus)自动维护总线,CP通过AMB向MAU报告故障,MAU通过AMB向CP发送命令。这是两侧CP与MAU之间的连线。(4)、CTB(CPUTESTBUS)CPU测试总线,在CP不可用时,MAU完成CPT功能。这是两侧CP与MAU之间的连线。(5)、PTB(ProcessorTestBus)处理机测试总线,连接MAU和IOG。CPT系统和MAU、IO系统的通信通过PTB来完成。三、CPS系统111、、、CCCPPPSSS系系系统统统的的的组组组成成成CPS包括两个CP处理器(包含CPU、DS、POWC、MAI和STUD等)和相应的软件,这些软件包括管理、程序的执行和引导,内存的分配以及测试等等。(应用软件也是存储在CP中,并由CP来执行,但从结构的角度来讲,它们是属于APT部分的)在正常的操作时,APZ软件和APT软件并没有很多交互,但是当存在APZ错误时,例如,一个闭塞的RP或者操作的改变(改SIZE等),就会发生一些APT和APZ之间的交互。不同的APT功能块彼此通信时通过APZ功能块来处理的,此时APZ功能块只是充当一个管道的功能,并不对传送的内容有任何改动。CPS跟APZ的其他子系统是紧密相关的,例如在处理器维护时跟MAS子系统,在LOAD软件和DUMP软件时跟IO子系统等。222、、、CCCPPPSSS系系系统统统的的的功功功能能能(1)作业执行和数据处理:根据不同作业优先级来处理,由软件、微程序控制,每条指令对应一段微程序。(2)FunctionChange:增加、删除、替换CP内的功能块。(3)备份处理:可以备份到CP内存中或者HD。(4)Loading:CPLoading、Reloading(自动和人工),内存的重新分配(PS、DS、RS)。(5)SizeAlteration:增加或减少数据文件的记录数。(6)ProgramCorrection:利用汇编语言,插入或删除程序补丁。(7)TestSystem:在不影响话务的情况下,跟踪信号和变量,也用于出厂前的测试。(8)处理机负荷统计:LOAS,打印CP负荷命令:PLLDP。(9)维护统计:收集系统状态信息和各种事件信息如Restart次数、Bit-Fault数量、内存大小等。(10)系统瘫痪时间、临时性、永久性故障等的记录。指令:DIRCP333、、、CCCPPP的的的状状状态态态第6页/共17页(1)、CP的正常状态当CP处于正常状态时,CP-A:EXCP-B:SB/WO处于正常状态的CP,EX、SB/WO两侧CP执行相同的工作(程序和数据均一致),EX侧控制RP、处理话务,SB/WO侧对两边的CP数据做比较工作,AMU处于“Passive”模式。(2)、CP的所有状态及其代表的含义EXEXECUTING:本侧CP控制话务,对RP有控制权SB/WOSTANDBYWORKING:本侧CP与EX侧执行相同的程序和数据、与EX侧热备用工作接受RP信号同时也向RP发送信号,但RP不读入数据仅作为校验用(检查RPB)可以无间断的接替执行侧CP的工作SB/SESTANDBYSEPERATE:本侧CP执行程序但不与EX侧比较和同步,用于FC。e.g:升位、CP初始启动、CPT接入等,控制信号只送分离的RP和分离的终端、被更新后成为SB/WO或直接成为EX侧命令:DPSES、FCSEI、PTSESSB/UPSTANDBYUPDATING:本侧CP被执行侧更新,目的是保持两侧CP的程序数据一致通过UMB从执行侧CP把执行数据和程序送入SB侧中间状态,successful---SB/WO,unsucessful---SB/HASB/HASTANDBYHALT:本侧CP停止工作,不执行程序原因:永久的硬件Fault、过于频繁的临时故障(芯片不稳定,干扰)命令:DPHAS(3)、CP状态间的转换CP状态转换图444、、、SSSYYYSSSTTTEEEMMMRRREEESSSTTTAAARRRTTT系统重启动是指强迫系统从一个已定义好的某一点重新开始执行,系统清除第7页/共17页CL型变量,软硬件功能块置初始状态。重启动并不能消除故障,只是系统试图从故障中恢复运行的方法。(1)、哪些情况会引起RESTART?盲选失败RPB的硬件故障(CP失去了与许多RP的联系)RPH的硬件故障软件故障人机命令:SYREI:RANK=,EXPL=;(2)、系统RESTART的三个级别及其完成的工作:SMALL:清除未建立(处于RE)呼叫、不影响已建立呼叫CL对已建立的呼叫检查Link(指针、BN、GS路径),若发现数据有错,拆除该呼叫清除作业缓冲区、JobTable恢复CL型变量的初始值ResetRPHLARGE:除半永久性连接不受影响,拆除所有呼叫,其他同SMALLRELOAD:系统对软件故障的最后措施,中断话务10~25分钟,清除所有呼叫,从HD的备份文件中装入程序和数据(重装整个PS、DS和RE型变量),LargeRestart后恢复话务。Start:初始启动,在SB/SE侧进行,APZ功能块自动启动,APT功能块由SYATI启动,不扫描EM。555、、、系系系统统统对对对软软软件件件故故故障障障的的的处处处理理理(1)软件故障的分类软件故障主要有:逻辑错误寻址越界:信号发给不存在的功能块、SN不存在。作业缓冲区满死循环(2)PHC电路工作原理及软件故障处理PHC电路实际上是一个加法计数器,CP每隔10ms送一个RESET信号脉冲给PHC,计数器清零;因此若系统正常工作,计数器永远不可能超过60ms(212:70ms)的限值。若系统发生故障,就无法送出周期性的RESET信号脉冲给PHC。计数器超过限值,PHC送PHE信号到AMU/MAU,AMU/MAU命令CP启RESTART或RELOADPHCI按键:按下PHCI按键,PHC的计数器停止计数(为0),PHC就不会送PHE信号给AMU/MAU,AMU/MAU亦不会命令CP启RESTART或RELOAD。第8页/共17页当系统检测到软件故障时,送PROGERROR信号给JOB,JOB进行一些必要的检查后把故障信息通过信号SYRRQ1送给SR,SR保存故障信息到变量OSDATA(H’2),然后执行一段死循环的程序。此时系统无法定期送出RESET信号脉冲给PHC,PHC电路不断计数,当超过60ms(212:70ms)的限值时