03.1汇编程序功能计算机是通过执行指令序列来解决问题的。计算机的指令系统就是指该计算机能够执行的全部指令的集合。指令的一般格式:[标号:]操作符OPD,OPS[;注释]算术运算和位操作类指令的部分单操作数指令的格式:[标号:]操作符OPD[;注释]1汇编语言程序的建立及开发过程编辑文本编辑器,如EDIT.COM源程序:文件名.asm汇编汇编程序,如MASM.EXE目标模块:文件名.obj连接连接程序,如LINK.EXE可执行文件:文件名.exe调试调试程序,如DEBUG.EXE应用程序错误错误错误错误2汇编程序的主要功能检查源程序测出源程序中的语法错误,并给出出错信息产生源程序的目标程序,并可给出列表文件(同时列出汇编语言和机器语言的文件,称为LST文件)展开宏指令33.2伪操作硬指令——使CPU产生动作、并在程序运行期间由计算机执行的语句。伪指令(Directive)——不产生CPU动作、在程序执行前由汇编程序处理的说明性语句,例如,数据说明、变量定义等等。伪指令与具体的处理器类型无关,但与汇编程序的版本有关。4汇编语言语句实例MOVCX,0;传送指令,具有2个操作数DELAY:NOP;空操作指令,没有操作数,带有标号LOOPDELAY;循环指令,标号DELAY说明转移位置BUFFERDB1,2,3,4,5,6,7;数据定义伪指令,在主存中开辟7个连续的字节单元,初值依次为1~7,BUFFER表示首地址53.2.1段定义伪操作1.完整的段定义伪操作存储器的物理地址是由段地址和偏移地址组合而成的,汇编程序在把源程序转换为目标程序时,必须确定标号和变量的偏移地址,并且需要把有关信息通过目标模块传送给连接程序,以便连接程序把不同的段和模块连接在一起,形成一个可执行程序。为此需要用段定义伪操作,格式如下:段名SEGMENT[定位][组合][使用]['类别']...;对数据段,附加段和堆栈段,一般是存储单元的定...;义,分配等伪操作,对代码段则是指令及伪操作.段名ENDS6完整段定义由SEGMENT和ENDS这一对伪指令实现,SEGMENT伪指令定义一个逻辑段的开始,ENDS伪指令表示一个段的结束段定义指令后的4个关键字用于确定段的各种属性,堆栈段要采用stack组合类型,代码段应具有‘code’类别,其他为可选属性参数如果不指定,则采用默认参数;但如果指定,注意要按照上列次序。7(1)定位类型:指定逻辑段在主存储器中的边界,可为:BYTE该段可以从任何地址开始,这样偏移地址可能不是0WORD该段必须从字的边界开始,即段起始地址必须为偶数DWORD该段必须从双字的边界开始,即段起始地址的最低两个十六进制数位必须为4的倍数PARA该段的起始地址必须从小段边界开始,即段起始地址的最低16进制数必须为08PAGE该段必须从页的边界开始,即段的起始地址的最低两个十六进制数位必须为0简化段定义伪指令的代码和数据段默认采用WORD定位,堆栈段默认采用PARA定位完整段定义伪指令的默认定位属性是PARA,其低4位已经是0,所以默认情况下数据段的偏移地址从0开始9(2)组合类型说明程序连接时的段合并方法,即指定多个逻辑段之间的关系,可为:PRIVATE本段为私有段,与其他段没有逻辑关系,在连接时不与其他段合并,每段都有自己的段地址。这是完整段定义伪指令默认的段组合方式PUBLIC连接程序把本段与所有同名同类型的其他段相邻地连接在一起,然后为所有这些段指定一个共同的段地址,也就是合成一个物理段。这是简化段定义伪指令默认的段组合STACK本段是堆栈的一部分,连接程序将所有STACK段按照与PUBLIC段的同样方式进行合并。这是堆栈段必须具有的段组合10(3)使用类型是支持32位段而设置的属性,用来说明使用16位寻址方式还是32位寻址方式对于16位x86CPU来说,它默认是16位段,即USE16而对于汇编32位x86CPU指令时,它默认采用32位段,即USE32;但可以使用USE16指定标准的16位段编写运行于实地址方式(8086工作方式)的汇编语言程序,必须采用16位段11(4)类别在引号中给出连接时组成段组的类型名。当连接程序组织段时,并不能把相同类别的段合并起来,但可将所有的同类别段相邻分配段类别可以是任意名称,但必须位于单引号中大多数MASM程序使用'code'、'data'和'stack’来分别指名代码段、数据段和堆栈段,以保持所有代码和数据的连续12此外,必须明确段与段寄存器的关系,可用ASSUME伪操作来实现。格式:ASSUME段寄存器:段名[,段寄存器名:段名,...]作用:通知MASM用指定的段寄存器来寻址对应的逻辑段,即建立段寄存器与段的缺省关系在明确了程序中各段与段寄存器之间的关系后,汇编程序会根据数据所在的逻辑段,在需要时自动插入段超越前缀。这是ASSUME伪指令的主要功能。13ASSUME伪指令并不为段寄存器设定初值,所以在代码段中还必须把段地址装入相应的段寄存器中。例如:定义数据段段名为DATA,则需使用MOV指令对DS段寄存器进行赋值。MOVAX,DATAMOVDS,AX如果程序中有堆栈段,也需要把地址装入SS中代码段不需要这样做,代码段的这一操作是在程序初始化时完成的。14例:完整的段定义伪操作data_1segment…data_1endsdata_2segment…data_2endscodesegmentassumecs:code,ds:data_1,es:data_2start:movax,data_1movds,axmovax,data_2moves,ax…codeendsendstart152.存储模型与简化段定义伪操作(1)MODEL伪操作格式:.MODELmemory_model[,modeloptions]用来表明存储模型,即用来说明在存储器中是如何安放各个段的.存储模型memorymodel决定一个程序的规模,确定进行子程序调用、指令转移和数据访问的缺省属性MASM有7种不同的存储模式:①TINY②SMALL③COMPACT④MEDIUM⑤LARGE⑥HUGE⑦FLAT16Tiny微型模型是MASM6.0才引入的,用于创建COM类型程序。用微型模型编写汇编语言程序时,所有的段地址寄存器都被设置为同一值,这意味着代码段、数据段、堆栈段都在同一个段内,不大于64KB;访问操作数或指令都只需要使用16位偏移地址。一般用于小程序。Small小型模型是最常用的一种模型。在小型模型下,一个程序至多只能有一个代码段和一个数据段,每段不大于64KB。这里的数据段指数据段、堆栈段和附加段的总和,它们共用同一个段基址,总长度不超过64KB;访问操作数或指令都只需要使用16位偏移地址;代码和数据都是近访问的,小模型下程序的最大长度为128KB17Compact紧凑模型适合于数据量大但代码量小的程序。在该模型下,代码段被限制在一个不大于64KB的段内;而数据段则可以有多个,超过64KB。代码是近访问的,而数据则可为远访问的。Medium中型模型是与紧凑模型互补的模型,适合于数据量小但代码量大的程序。中型模式的代码段可以超过64KB,有多个;但数据段只能有一个不大于64KB的段。数据是近访问,而代码可远访问。Large大型模式允许的代码段和数据段都有多个,都可以超过64KB;但全部的静态数据(不能改变的数据)仍限制在64K字节内.数据和代码都可以远访问。18Huge巨型模型与大型模型基本相同,只是静态数据不再被限制在64K字节之内。Flat平展模型用于创建一个32位的程序,它只能运行在32位x86CPU上。DOS下不能使用FLAT模型,而编写32位Windows9.x或Windows-NT的程序时,必须采用FLAT模型。DOS下编程可选择前六种模型,一般可以选用SMALL模型,TINY模式产生COM程序,其他模型产生EXE程序,FLAT模型只能用于32位程序。19Modeloptions允许用户指定三种选项:高级语言接口、操作系统和堆栈距离。高级语言接口选项是指该汇编语言程序作为某一种高级语言程序的过程而为该高级语言程序调用时,应该用C等来说明。操作系统选项是要说明程序运行于哪个操作系统之下,可用OS_DOS或OS_OS2来说明,默认是OS_DOS。堆栈距离选项可用NEARSTACK或FARSTACK来说明,基中NEARSTACK是指堆栈段和数据段组合到一个DGROUP段中,而FARSTACK是指堆栈段和数据段并不合并。例如:.MODELSMALL,C.MODELLARGE,OS_DOS20(2)简化的段定义伪操作简化段定义伪指令指明一个逻辑段的开始,同时自动结束前面的一个段。采用简化段定义伪指令前,需有.model语句。常用:.STACK[大小];堆栈段开始.DATA;数据段开始.CODE[段名];代码段开始.STACK[大小]堆栈段伪指令.STACK创建一个堆栈段,段名是:stack,它的参数指定堆栈段所占存储区的字节数,默认是1KB(=1024=400h字节)21.DATA数据段伪指令.data创建一个数据段,段名是:_DATA。它用于定义具有初值的变量,当然也允许定义无初值的变量。无初值变量可以安排在另一个段中,它用.data?伪指令创建,数据段名是:_BSS。.const伪指令用于建立只读的常量数据段(段名:CONST).CODE[段名]代码段伪指令.code创建一个代码段,它的参数指定该代码段的段名。如果没有给出段名,则采用默认段名:在TINY、SMALL、COMPACT和FLAT模式下,默认的代码段名是:_TEXT;在MEDIUM、LARGE和HUGE模式下,默认的代码段名是:模块名_TEXT。22(3)与简化段定义有关的预定义符号使用简化段定义,各段名称和其他用户所需的信息可以使用MASM预定义符号,例如:@data表示由.data等定义的数据段的段名。(4)简化段定义举例.MODELSMALL.STACK100H.DATA….CODESTART:MOVAX,@DATAMOVDS,AX…MOVAX,4C00HINT21HENDSTART233.段组定义伪操作格式:组名GROUP段名[,段名,...]把多个同类段合并为一个64KB物理段,并用一个组名统一存取它定义段组后,段组内各段就统一为一个段地址,各段定义的变量和标号的偏移地址就相对于段组基地址计算offset操作符取变量和标号相对于段组的偏移地址,如果没有段组则取得相对于段的偏移地址。offset后可以跟段组中的某个段名,表示该段最后一个字节后面字节相对于段组的偏移地址243.2.2程序开始和结束伪操作程序开始可用Name和TITLE作为模块的名字。NAME的格式:NAME模块名汇编语言将以给出的”模块名”作为模块的名字。TITLE的格式:TITLE标题TITLE伪操作可指定列表文件中的每一页上打印的标题END表源程序结束的伪操作,格式为:END[标号]用来指示汇编程序MASM到此结束汇编过程。源程序的最后必须有一条END语句。可选的标号用于指定程序开始执行点,连接程序将据此设置CS:IP值25MASM6.0还增加了定义程序入口点和出口点的伪操作。用.STARTUP定义程序的初始入口点,并产生设置DS,SS和SP的代码。如果程序采用了.startup伪指令就不需要再用“end标号”指明开始执行点,但还要有end伪指令.EXIT用来产生退出程序并返回操作系统的代码,其格式:.EXIT[返回参数]可选参数是一个返回的数码,通常用0表示没有错误。例如.exit0对应的代码是:MOVAX,4C00HINT21HDOS功能调用的4CH子功能(返回DOS):入口参数:AH=4CH,AL=返回数码263.3参数、变量和标号本节详细讨论汇编语言程序语句的主要部分:参数变量名标号并引出相关的伪指令和操作符本节重点掌握:–常数的表达–变量定义伪指令DB/DW/DD、