6汉字操作系统概述 铨

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

汉字操作系统概述一、汉字操作系统产生的背景汉字处理是国内包括税务系统常规信息处理的重要内容。MS-DOS是西文操作系统,不具有输入/输出汉字的能力,因此,若要进行汉字处理,必须改造和扩充西文DOS的能力。早在70年代,我国就开始对汉字信息处理技术进行研究并取得了一定成果。进入80年代后,由于微机的发展,促使汉字信息处理有了重大突破,并研制成功了第一个汉字操作系统,定名为CCDOS。这是由原电子工业部第六研究所在PC-DOS的基础上为IBM-PC及其兼容机开发的操作系统。随着计算机的发展,汉字系统已经历了三代,最早的CCDOS汉字系统,其基本满足汉字信息处理的要求,但处理速度慢,点阵字模不美观等。发展到第二代,出现了UCDOS、SUPER-CCDOS2.13等,它们在处理速度上有了很大提高,也有了较为精美的汉字字库。到了第三代,汉字系统已能支持直接写屏,如UCDOS5.0、CXDOS6.0、天汇3.0等。这样,对西文软件无须汉化便能处理汉字了。另外,WINDOWS除了使用中文WINDOWS之外,也可用西文WINDOWS再在其上运行汉字系统解决汉字问题,如中文之星、四通立方RichWinforWindows系列等。这些汉字系统字库更精美、更繁多,功能更强大,使中文信息处理更加迅捷便利。二、汉字操作系统如何处理汉字的输入、存储和输出1.汉字的输入要进行汉字输入首先要解决汉字的编码问题,主要是汉字在机内如何表示。通常每个西文字符只占一个字节的存储区。但由于汉字的数目众多(属于大字符集),因此需要采取不同的表示方法。为统一标准,1981年我国公布了《通信汉字字符集及其汉字交换标准》(GB2312-80)。在此方案中,共收录了6763个常用汉字,其中较常用的3755个汉字组成一级字库,按拼音顺序排列;其余3007个汉字组成二级字库,按部首顺序排列。有了这个基本集,就可对这一定数量汉字集内的每个汉字编成相应的一组英文或数字代码,使其能直接使用西文键盘输入汉字。当前,汉字输入编码已经“出台”的方案有上百种,实际使用的也有几十种,根据编码方案设计时所依据的不同汉字属性,可将它们分成:形码,音码,音形码,区位码。形码形码:根据汉字的字形结构来编码。它的优点是:码长(所谓码长是一个汉字编码的字符个数)较短、重码(所谓重码是指同一编码对应多个汉字)率低、直观,不受操作者文化程度高低、是否识字和各地方言不同的影响,只要看到字形,就能按规则击键输入。缺点是:有一套汉字的拆分规则要掌握,字根(若干笔画复合连接交叉,形成相对不变的结构)在键盘上的分布规律要记忆。音码音码:根据汉字的读音进行编码。它的优点是:一般学过汉语拼音的人就可以输入汉字,易学,直观,不受字体变化的影响。缺点是:码长较长,重码率高,不会读或发音不准确的字无法用拼音输入。音形码音形码:兼顾了汉字的字音、字形(或字义)而构成的汉字输入编码。优点是:吸取了音码和形码的长处,重码率低。缺点是:编码规则复杂难于学习和记忆。语音输入中文语音输入技术已经基本成熟中文的地方语音体系主要有:广东话,闽南话,吴语等手写输入从技术发展的角度说,更为重要的是手写板的性能。手写板主要分为三类:电阻式压力板、电磁式感应板和近期发展的电容式触控板。目前电阻式压力手写板技术落后,几乎已经被市场淘汰。电磁式感应手写板是现在市场上的主流产品。电容式触控手写板作为市场的新力量,由于具有耐磨损、使用简便、敏感度高等优点,是以后手写板的发展趋势。区位码区位码:根据汉字在汉字集中的位置而进行编码。优点是:汉字与码组有严格的对应关系,不需进行二次选择。缺点是难于记忆。现在,我们常见的输入法有。拼音输入法,自然码输入法,表形码输入法,五笔字形输入法等。其方法各异,各有其特点。在众多汉字输入法中还广泛采用了一些辅助手段,如:词组输入,联想输入等,以提高汉字输入的速度。汉字机内码汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。汉字交换码汉字交换码是指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。自国家标准GB2312-80公布以来,我国一直延用该标准所规定的国标码作为统一的汉字信息交换码。2.汉字的存储在实际汉字系统中,都是用两个字节来表示一个汉字,也即一个汉字对应两个字节的二进制码,也就是说,用两个字节对汉字进行编码,这样即可将我们采用的汉字编入标准汉字代码中,输入时,我们输入进计算机的就是这两个字节的汉字代码,存储亦然。3.汉字的输出确定了汉字的机内码仅仅决定了每个汉字在国标字符集中的位置,但并不能说明每个汉字的形状。因此,要完成汉字的输出任务还需要字型数据。在微机上,大多数的文字或图形的形状都是用“点”来描述的。存储这些点由1和0来实现,输出时,计算机把1解释成“写点”,把0解释为“不写点”。这样,汉字的点阵数据就与屏幕上的图形对应起来。为了能够显示汉字,在国标集中的每个汉字都需要事先确定其点阵形状,然后点阵转换成对应的数据,一般以文件形式存放到计算机中,就构成了汉字的字型库或简称为字库。汉字的显示一般需要一系列的步骤。例如,首先将用户从键盘输入的汉字编码(输入码)转化成机内码,然后根据内码从字库中查找到该字的字模数据,再将字模写到屏幕或输出到打印机。

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功