文字编码教学目的•掌握ASCII码,区位码和机内码的概念;•掌握输入码、字形码的概念字符编码ASCII(AmericanStandardCodeforInformationInterchange)美国信息交换标准码ASCII码表ASCII码规律:(1)ASCII码值就是该字符在编码集中的位置,用十进制数表示。(2)数字0~9由小到大排列,ASCII码分别为48~57,ASCII码与数值恰好相差48。•(3)在英文字母中,A的ASCII码值为65,a的ASCII码值为97,且由小到大依次排列。因此,只要我们知道了A和a的ASCII码,也就知道了其他字母的ASCII码。•ASCII码规律:标准ASCII码0×××××××标准的ASCII码使用一个字节中的7个位来表示128个字符。如:t的ASCII码是116,也就是01110100B练习•国际上普遍采用的美国国家信息交换标准码是()A拼音码B五笔码CGB2312码DASCII码•7.标准ASCII码最多能够表示的字符个数是A128B127C64D8练习•1.大写字母C的ASCII码为67,则大写字母A的ASCII值是()•A69B68C65D63•2.下列数值最小的是()•A(1101)2B(1110)2C(12)10D(16)10•3十进制数14的二进制表示是()•A111B11110C1111D1110汉字编码汉字与英文字符一样,也是一种字符,在计算机内部也是以二进制代码形式表示的,这些代码,称为汉字编码。GB2312-1980使用2个字节编码,共收录6763个简体汉字,其中包括:一级汉字3755个,以拼音顺序排列;二级汉字3008个,以偏旁笔画顺序排列。一个汉字用2个字节(16个二进制位)来表示如:“中”在GB2312中对应的编码是:0011011000110000汉字除了最常用的GB2312编码外还有其它几种编码方案汉字编码字符科普知识ABC内码BFC6C6D5D6AACAB6414243汉字编码•对于汉字,计算机的处理技术必须解决三个问题:汉字输入、汉字储存与交换、汉字输出。因此,汉字编码系统存在以下种编码:•1、汉字输入码•2、汉字交换码•3、汉字机内码(处理码)•4、汉字字模码汉字输入码利用汉字的音、形或其他相关的特征信息,按照一定的规则,对指定的汉字集编制相应的代码,这种代码称为输入码。输入码主要有:•音码(智能ABC、拼音输入法等)•形码(如五笔字型等)•音形码(以字音为主辅以字形特征的编码)•形音码(以字形为主,辅以字音特征的编码)•例某输入法用五个键对应汉字的五种基本笔画,按笔画顺序取该字的前四笔和最后一笔输入文字,若有些字用该方法不知如何输入,可以启用同音输入选项,即用上述方法输入“码”,就会显示与码同音的文字以供选择,该输入法属于()A音码B形码C音形码D形音码汉字交换码•在《信息交换用汉字编码及字符集》中,将汉字分为94个区,每个区包含94位,构成一张94*94的表格,这种编码叫做区位码。•区位码也称为GB2312编码。每个汉字由两个字节组成汉字机内码•汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。•汉字可以通过不同的输入法输入,但其内码在计算机中是唯一的。•英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“1”。•机内码等于汉字国标码加上8080H。例如“中”字的机内码为D6D0H。•例用UltraEdit软件观察字符内码得到两个十六进制数为D6B6,下列说法正确的是()A可能是两个0~9之间的数字B可能是一个GB2312编码的汉字C可能是两个大写的英文字母D可能是两个小写的英文字母汉字字模码•汉字字模码又称汉字字形码,它是将汉字字形经过点阵数字化后形成的一串二进制数,用于汉字的显示和打印。•根据汉字输出的要求不同,点阵有以下几种:–简易型汉字:16×16,32字节/汉字–普通型汉字:24×24,72字节/汉字–提高型汉字:32×32,128字节/汉字。•汉字字库:将所有汉字的字模点阵代码按内码顺序集中起来,构成了汉字库。汉字输入码汉字交换码(国标码)汉字输入法程序汉字字模码字形检索程序汉字显示汉字打印汉字内码+8080H练习•1、汉字的字型可用点阵来表示和存储。如果一个汉字要用24*24点阵来存储,则要存储2048个汉字需要()KB的存储空间。•A.288B.144C.128D.72•2、一个汉字用两个字节表示,而两个字节编码可以表示()个汉字。A.215B.216C.216-1D.6763