大学计算机基础教程主讲教师:潘家英手机:13978689191邮箱:jypan@gxtcmu.edu.cnQQ:1076287辅导教师:黄宁恩上课时间:2006年9月第四章汉字信息处理基本知识§4.1汉字信息处理的基本问题§4.2微机汉字信息处理系统的构成和使用目录上课时间:2020年1月27日星期一§4.1汉字信息处理的过程一、计算机处理汉字的过程二、汉字编码标准三、汉字输入方法四、汉字字模库五、汉字的显示输出六、汉字的打印输出七、返回一、计算机处理汉字的过程输入码机内码字模库区位五笔全拼、双拼键盘输入文字处理软件编辑加工字形码显示器打印机返回二、汉字编码标准1、国标码2、区位码3、机内码4、返回1、国标码(交换码)1)简介:为了用0、1代码串表示汉字,在汉字系统或通信系统之间交换信息,必须给每个汉字规定一个统一的代码。1981年发布“国家标准《信息交换用汉字编码字符集基本集》”,代号为“GB2312-80”。该基本集共收集字符7445个:一级:最常用汉字3755个,按拼音排序二级:次常用汉字有3008个,按偏旁部首排序另外还有图形符号682个。2)特点:①编码规则:双七位二进制编码,每个七位从21H(0100001)变到7EH(1111110);②排列:分为94个区,每个区分为94个位;汉字第1个七位第2个七位十六进制例:啊011000001000013021H第一个7位,行第二个7位,列返回2、区位码用区号和位号来表示汉字的编码。(区位号都用两位十进制数表示。例:啊-------1601区位码和国标码的关系:国标码=区位码(十六进制表示)+2020H区号位号1001H+2020H=3021H返回3、机内码在计算机内部存储、处理、传送所使用的汉字的编码。不同的计算机系统使用的机内码是不同的。微机上的机内码的特点:用两个字节表示,每个字节最高位为1。和国标码的关系:机内码=国标码(十六进制表示)+8080H例:啊的机内码:3021H+8080H=B0A1H返回三、汉字输入方法汉字输入方法是指如何将汉字转换成对应的机内码,并送入计算机存储起来。输入方法:•通过语音•通过光学字符阅读器(OCR)•通过键盘键盘输入法(编码输入法):•音码:以语音为特征,例全拼、双拼等•形码:以字型为特征,例五笔等•音形结合码:例智能ABC、自然码等•其他:区位码(一字一码)返回四、汉字字模库1)字形码的表示:•点阵表示•失量表示2)基本概念:字模:描述一个汉字点阵信息的二进制代码。字库:所有汉字及各种符号字模集合。汉卡:将字库装在只读存储器中。软字库:将字库装在外部存储器上。24×24点阵的1个汉字,须占多少字节?1000个24×24点阵的汉字,须占多大的存储空间?返回五、汉字的显示输出汉字显示输出的过程:从键盘输入的汉字经过键盘管理程序,变换成机内码,然后经字模检索程序,查到机内码对应的点阵信息在字模库的地址,从字库中检索出该汉字点阵信息,利用驱动程序将这些信息送显示卡的显示缓冲存储器中,显示器的控制器把点阵信息整屏顺次读出,并使每一个二进制位与屏幕的一个点位相对应。一般的显示器在文本状态下可显示25行、80列请看演示六、汉字的打印输出汉字打印输出的过程:先将欲打印的汉字机内码送到内存的打印缓冲区,然后从中逐个取出机内码,通过字模检索程序从字模库中检索出该汉字的点阵信息,存入内存的字模缓冲区中,通过字模变换程序把点阵信息转换,使之适合打印机输出,然后由多功能卡送到打印机的打印数据缓冲区中。请看演示§4.2微机汉字信息处理系统的构成和使用现有微机汉字信息处理系统构成的一个指导思想是:尽量利用原有西文计算机的硬件,通过改造系统软件,做到在原有处理西文的基础上,增加处理中文的功能,而不降低原系统的效率。汉字信息处理系统的硬件:在原有的西文计算机的硬件基础上,增加汉字库,有软字库或硬字库。软字库可以放在软盘或硬盘使用时调入内存。有些打印机自带硬字库。汉字信息处理系统的软件:系统软件:DOS及其中文平台、WINDOWS中文版、能处理汉字的高级程序设计语言及其编译器等。应用软件:例电子出版系统(北大方正)、桌面排版系统(WORD2000、WPS2000)、数据库管理系统(VFP、Access等)WINDOWS2000:中文操作系统的使用1、汉字输入法的安装:“开始”“设置”“控制面板”“输入法”2、输入法综合设置“开始”“设置”“控制面板”“键盘”2、汉字输入法的启动和关闭:启动:单击“任务栏”上的输入法指示器或用Ctrl+Shift选择关闭:单击“任务栏”上的输入法管理框或用Ctrl+空格来进行关闭/打开切换注意:中文输入一定是小写字母状态。(教师可现场演示:以记事本为例)3、汉字输入法状态框:中/英文切换按钮输入法名称框半角/全角切换按钮中/英文标点切换按钮(表4.2)软键盘开关半角和全角的概念:半角方式:汉字按国标GB2312-80编码,使用两字节内码表示一个汉字。而英文字符仍为ASCII码编码。是一种中西文混合方式全角方式:无论汉字或英文字符及其他符号,一律按国标编码,以称为纯中文方式。这时英文字符、标点符号和数字使用两字节机内码,屏幕显示占两个ASCII码字符的位置。4、编码框和词语选择框输入汉字时必须用小写字母。有重码时,会出现词语选择框,可以用“-”(往回翻页)和“+”(往后翻页)进行翻页选择,可以按ESC键取消编码框。本次上机的内容:1、在C盘根目录下创建自己的目录,来管理自己的文件2、有关汉字输入法的问题。P753、OFFICE软件的安装。4、WORD界面的认识。P102返回