1汉字编码12•采用字节(byte)作为计算机存储信息的基本计量单位。•1个字节由8个二进制位(bit)来组成,可以表示1个英文字母、数字或符号•存贮一个汉字需要两个字节数据(存储)单位与换算关系1Byte=8bit1KB=1024Byte=210Byte1MB=1024KB=220Byte1GB=1024MB=230Byte1TB=1024GB=240Byte存储单位1MB容量能大概能存多少汉字?50万汉字3信息的表示与存储编码:计算机存储和处理信息时,都采用二进制数字形式,即计算机所处理的所有的数、字母、符号都要用二进制编码来表示。4信息的表示与存储——ASCII码ASCII码(美国信息交换标准码)字符编码方案,七位二进制码例如:数字“3”——00110011字母“A”——01000001字母“a”——01100001D7D6D5D4D3D2D1D000001011符号数值部分5信息的表示与存储——ASCII码ASCII码(美国信息交换标准码)字符编码方案,七位二进制码例如:数字“3”——00110011字母“A”——01000001字母“a”——01100001汉字“群”—10010000111010(国标码)6ASCII表7掌握:48~57号为0~9十个阿拉伯数字;65~90号为26个大写英文字母,97~122号为26个小写英文字母1、每个符号对应一个ASCII码值;2、根据符号ASCII码值大小可以比较符号大小;例如:数字大写字母小写字母依据ASCII码表,必须掌握以下两点;8关于ASCII码的一些试题举例:2、若已知字母Y的ASCII码为1011001B,则字母X的ASCII码用十六进制表示是()A.59HB.58HC.5AHD.1011000H3、按从小到大顺序排列“3”“a”“Z”“S”“9”“d”的选项是()A.3aZS9dB.93adzsC.39SZadD.39adSZAC1、下列关于ASCII编码的叙述中,正确的是()A)国际通用的ASCII码是8位码B)所有大写英文字母的ASCII码值都小于小写英文字母“a”的ASCII码值C)所有大写英文字母的ASCII码值都大于小写英文字母“a”的ASCII码值D)标准ASCII码表有256个不同的字符编码B9信息的表示与存储——汉字编码•在汉字系统中,每个汉字对应两个英文字符宽度。即一个汉字占用两个字节。–在汉字的存储、输入和输出中,处理的并不是汉字本身,而是汉字的编码。–不同的环境下有不同的汉字编码。如汉字交换码(国标码或国际码)、汉字机内码、区位码和各种汉字的输入码。10信息的表示与存储——汉字编码•区位码:计算机在信息处理时表示汉字的编码应该规定统一的编码,我国制定了汉字交换的统一标准——GB2312-80,我们简称为区位码。注意:区号范围1~94,位号范围1~94;例:“学”字的区位码为:4907D区号:位号:转换为十六进制表示为:49073107H11•国标码:是汉字信息交换的代码。也称交换码、国际码。–区位码与国标码的换算:国标码=十六进制的区位码+2020H即将区位码的十进制区号和位号分别转换成十六进制数,然后分别加上20H,就成了汉字的国际码。如:“学”字的区位码为:4907D十六进制表示为:3107H“学”的国际码?国际码:3107H+2020H=5127H12信息的表示与存储——汉字编码机内码:计算机系统内部标识汉字的编码。一个汉字由两个字节组成,为了与ASCII码区别,最高位均为“1”。–国标码和机内码的换算:机内码=十六进制的国际码+8080H如:“学”字的区位码为:3107H国际码:5127H“学”的机内码?机内码:5127H+8080H=D1A7H13国标码=十六进制的区位码+2020H机内码=十六进制的国际码+8080H机内码=十六进制的区位码+A0A0H备注:机内码每个字节一定大于A0HA:D1A7H下列十六进制数中可能是机内码选项()B:71A7HC:D197HD:B1C7HAD14信息的表示与存储——汉字编码例:“大”字的区位码为2083,求该字的国标码和机内码分析方法步骤:(1)区码和位码分别转换成十六进制数表示(2)(区位码的十六进制表示)+2020H=国标码;(3)国标码+8080H=机内码解:①该字的区号为20,位号为83②将区位号2083分别转换为十六进制表示为③1453H+2020H=,得到国标码为1453H3473H3473HB4F3HB4F3H④3473H+8080H=,得到机内码为15汉字编码0011110001001110101111001100111016汉字编码汉字的存储与字库为了输出汉字,必须存储汉字的字型。(1)矢量化:它由一组指令来描述字符的外形(轮廓)。这种字体也称为轮廓字体(TrueType字体)。(2)点阵图形:将汉字分解为若干个“点”组成的点阵字型方式。17存储每个汉字的字型信息需要1616个二进制位,共2*16=32字节。18汉字编码汉字字库:汉字字型信息的集合两级字库(国标):第一级为常用汉字,共3755个第二级为次常用汉字,共3008个对6763个汉字进行编码,至少需要13位二进制才能表示。(因为212=40966763213=8192)2个字节表示一个汉字信息。