第二章信息在计算机内的表示2.1数据和信息2.2二进制2.3数值信息在计算机内的表示2.4西文信息在计算机内的表示2.5中文信息在计算机内的表示2.6图形信息在计算机内的表示NanjingNormalUniv.Dept.ofComputerScience2.1.1数据P8ISO的定义:数据是对事实、概念或指令的一种特殊表达形式,这种特殊表达形式可以用人工的方式或者用自动化的装置进行通信、翻译转换或者进行加工处理。一般的数字、文字、图画、声音、活动图像都是数据,计算机通过二进制编码形式对其进行处理。计算机内部把数据区分为数值型和非数值型。NanjingNormalUniv.Dept.ofComputerScience2.1.2信息P8信息是有用的数据。计算机信息处理的本质就是进行数据处理。数据处理的目标是获得有用信息。注意“信息系统”的用法。常将信息系统称为:管理信息系统MIS(ManagementInformationSystem)或数据处理系统DPS(DataProcessingSystem)NanjingNormalUniv.Dept.ofComputerScience2.2二进制P9什么是二进制何谓十进制?s=knkn-1….k0k-1k-2….k-m特点:基数为十,逢十进一。二进制特点:基数为二,逢二进一二进制优点:0,1两个状态易物理实现;运算规则简单。NanjingNormalUniv.Dept.ofComputerScience二进制与十进制对照表(记忆)十进制二进制十进制二进制00000601101000170111200108100030011910014010010101050101111011NanjingNormalUniv.Dept.ofComputerScience二进制数的运算P10算术运算:加法、减法。0+0=00+1=11+0=11+1=100-0=00-1=11-0=11-1=0逻辑运算:或(∨)、与(∧)、取反。0∨0=00∨1=11∨0=11∨1=1大口朝上谁大听谁的0∧0=00∧1=01∧0=01∧1=1小口朝上谁小听谁的0取反为11取反为0注意:算术运算会发生进位、借位,逻辑运算则按位独立进行,不发生位与位之间的关系。NanjingNormalUniv.Dept.ofComputerScience2.2.3不同进制间的转换二进制八进制十进制十六进制NanjingNormalUniv.Dept.ofComputerScience二、八、十六进制化为十进制规则:按“权”展开例:(1999.8)10=1╳103+9╳102+9╳101+9╳100+8╳10-1“权”(1101.1)2=1╳23+1╳22+0╳21+1╳20+1╳2-1NanjingNormalUniv.Dept.ofComputerScience二、八、十六进制化为十进制P11例1:将二进制数101.01转换成十进制数。(101.1)2=1╳22+0╳21+1╳20+1╳2-1=(5.5)10例2:将八进制数34.6转换成十进制数。(34.6)8=3╳81+4╳80+6╳8-1=(28.75)10NanjingNormalUniv.Dept.ofComputerScience例3:将十六进制数2AB.6转换成十进制数(2AB.6)8=2╳162+10╳161+11╳160+6╳16-1=(683.375)10二、八、十六进制化为十进制P11NanjingNormalUniv.Dept.ofComputerScience十进制化为二进制P11十进制整数化为二进制整数规则:除二取余,直到商为零为止,倒排例:将十进制数86转化为二进制2|86……02|43……12|21……12|10……02|5……12|2……02|1……1所以,(86)10=(1010110)20NanjingNormalUniv.Dept.ofComputerScience十进制化为二进制P11十进制小数化为二进制小数规则:乘二取整,直到小数部分为零或给定的精度为止,顺排例:将十进制数0.875转化为二进制数0.875╳21.750.75╳21.50.5╳21.0所以(0.875)10=(0.111)2NanjingNormalUniv.Dept.ofComputerScience八进制化为二进制P12规则:每一个八进制数改写成等值的三位二进制数,次序不变例:(17.36)8=(001111.011110)2=(1111.01111)2NanjingNormalUniv.Dept.ofComputerScience十六进制化为二进制P12规则:每一个位十六进制数改写成等值的四位二进制数,次序不变例:(3A8C.D6)16=(0011101010001100.11010110)2=(11101010001100.1101011)2NanjingNormalUniv.Dept.ofComputerScience二进制化为八进制P12规则:每三位二进制数改写成等值的一位八进制数,次序不变例:(11001111.01111)2=(11001111.011110)2=(317.36)8NanjingNormalUniv.Dept.ofComputerScience二进制化为十六进制P12规则:每四位二进制数改写成等值的一位十六进制数,次序不变例:(11001111.01111)2=(11001111.01111000)2=(CF.78)16NanjingNormalUniv.Dept.ofComputerScience二进制计量单位P13比特:bit,或称位元,简称位,0或1;以“b”表示,最小单位。字节:byte,位组,8个bit;以“B”表示,一个字符用一个字节表示。字:word,表示方法不统一。1KB=1024B,1MB=1024KB,1GB=1024MB;1TB=1024GB速率:波特,b/s,bps;2400b/s,56kb/s。NanjingNormalUniv.Dept.ofComputerScience2.3数值信息在计算机内的表示P13正整数(不带符号的整数)8位:0~255,16位:0~65535带符号整数符号位(0:正;1:负)最高位为符号位(原码表示法)8位:-127~127,16位:-32767~+32767NanjingNormalUniv.Dept.ofComputerScience原码、反码、补码P14原码:将整数化为二进制数,符号位置0(正数)或1(负数)反码:负数的反码:符号位为1,绝对值部分与原码相反。负数的补码表示:符号位也是“1”,其余为反码的最低位加“1”。NanjingNormalUniv.Dept.ofComputerScience原码、反码、补码P14注意:-0与+0在补码表示法中相同,而在原码、反码表示却不同。相同位数的二进制补码,表示的范围比原码、反码多一个(why?)。正数的原码、反码、补码都相等,即表示方法只有一种NanjingNormalUniv.Dept.ofComputerScience实数P14浮点表示法(浮点数):用指数(整数)和尾数(纯小数)来表示实数的方法。浮点数的表示方法不唯一,长度越长,范围越大,精度越高。IEEE的浮点数标准。PC中有:16位整数、短整数(32位)、长整数(64位),单精度(32位)、双精度(64位)和扩充精度(80位)浮点数。NanjingNormalUniv.Dept.ofComputerScience2.4西文信息在计算机内的表示P15字符包括:字母、数字、标点符号等。字符集:每一字符各有一个代码,构成代码表。ASCII码:一个字节的编码对应一个字符,最高位一般为0,是7位编码,可表示128个,如0110001为1、1000101为E等。EBCDIC码:8位编码,可表示256个字符。NanjingNormalUniv.Dept.ofComputerScience2.5中文信息在计算机内的表示P16汉字字符集与编码1981年,GB2312-80国家标准,其中有6763个汉字和682个非汉字字符,其字符及编码称为国标码又叫国际交换码。GB2312字符集的构成:一级常用汉字3755个,按汉语拼音排列二级常用汉字3008个,按偏旁部首排列非汉字字符682个NanjingNormalUniv.Dept.ofComputerScience汉字字符集与编码P16GB2312构成两维平面(区位码),94*94,行号为区号,列号为位号,各占一个字节,取其7位表示。例:“大”的区号是20,位号是83,则其区位码为:2083。(0001010001010011)区位码+32=国标码;0011010001110011汉字以双字节表示,各字节的最高位为1的汉字编码叫“机内码”,或“内码”。例:“大”的区号是20,位号是83,则其机内码为:1011010011110011NanjingNormalUniv.Dept.ofComputerScience汉字字符集与编码P17内码的表示方法可以不同。BIG5--台湾,420个图形符号,13070个汉字,繁体。ISO/IEC10646,即UCS(国际),中国标准为GB13000,其编码空间大,缺点是效率低;其简化方案为UCS-2,Unicode编码,长度为16位,CJK编码为此方案的大中国区的统一编码。NanjingNormalUniv.Dept.ofComputerScience汉字字符集与编码P17Windows支持Unicode编码,但其空间仍不足,且与ASCII不兼容。新的编码为GBK:与GB2312-80完全兼容,支持GB13000的CJK汉字和BIG5中的非汉字符号。NanjingNormalUniv.Dept.ofComputerScience2.5.2汉字的输入P18方法:手写汉字联机识别、扫描输入识别、键盘输入。输入编码要求:易学、易记、效率高、重码少、容量大。输入编码分类:数字编码(如:区位码、电报码,难记)、字音编码(简单,但重码多)、字形编码(如:五笔字形、表形码,重码少,规则难)、形音编码(规则简单、重码少,学习不易)。NanjingNormalUniv.Dept.ofComputerScience汉字字符集与编码P18注意:汉字输入编码、内码和交换码概念不同,同一个汉字的内码、交换码是一样的,但其可以用不同的输入编码方法输入计算机。NanjingNormalUniv.Dept.ofComputerScience2.5.3汉字的输出P18字库(font):汉字字符的形状描述信息集合,不同的字体对应不同的字库。字形描述方法:点阵字形(“1”表示对应位置是黑点、“0”表示是空白)轮廓字形(用曲线描述,精度高、字形可变,如:Windows中的TrueType)NanjingNormalUniv.Dept.ofComputerScience2.6图形信息在计算机内的表示P19图像(Image):把画面离散成mxn个像素点所组成的矩阵,黑白画面像素点用一个二进制位来表示亮度,彩色画面用三个分量表示(R、G、B)。图形(Graphics):利用几何要素进行描述。NanjingNormalUniv.Dept.ofComputerScience练习1.将二进制数(101101)2转换为十进制数,结果为:A.45.1B.46C.45D.542.下面四个数,最大的是A.(CA)16B.(310)8C.(201)10D.(11001011)23.在一个非零的无符号二进制整数的右边加两个0,形成一个新的二进制数,其值是原数的_____倍。NanjingNormalUniv.Dept.ofComputerScience练习4.字节是计算机中表示_______的最小单位。5.