4.1-文本信息加工课件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

主讲教师:冯坤山e_mail:a.h100@163.com第18周文本信息加工2本章目录文本和表格信息加工是人性化信息加工的两类重要应用,通过本章的学习,你将进一步体验和认识文本信息加工和表格信息加工的实际价值,特别是如何根据需要选择适当的表达方式去有效地表达信息。本章需要你勤于动手、善于思考,从中总结经验、发现规律。4.1本文信息加工4.2表格信息加工第18周文本信息加工34.1文本信息加工学习目标体验文字处理技术的发展变化及其意义;了解文字在计算机中的编码方式第18周文本信息加工文本信息加工第18周文本信息加工4.1.1文字及其处理技术一、体验文字处理技术文字是人类为了更加流畅地表述意义,传递经验发明的工具,人们利用文字记载自然变化、历史沿革、生产经验、建设成果等各种信息,极大促进人类文明的发展进程。思考:汉字是怎么造出来的?1.概述第17周信息智能化加工汉字的造字法有四种:象形、指事、会意、形声。从字体上看,就是本字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。(上、下、刃等)象形指事象形文2.汉字的造字法用图画依照物体的形状或者样子描绘出来表示的文字将一些很难解释的事物当做一个字。第17周信息智能化加工金文「明」为日月幷照之会意字。(信=人+言)会意形声字的一部分是“形旁”表示字义,一部分是“声旁”表示读音,如:“清”是“水”形“青”声,“河”是“水”形“可”声。指把两个字拼在一起变成另一个字一般是将两字和在一起变成另一个字,一边表示声音,一边表示形态第17周信息智能化加工猜一猜:以下象形字分别是什么?(休)(采)(焚)(甘)(刃)第17周信息智能化加工东巴文字东巴文是一种原始的图画象形文字,主要为东巴教徒传授使用,书写东巴经文,故称东巴文。纳西话叫“思究鲁究”,意为“木迹石迹”,见木画木,见石画石。东巴文字是唯一活着的象形文字。第17周信息智能化加工云南纳西族东巴文字猜猜看,上面的象形文字究竟表示什么意思?靠睡登越喝牙齿看书去•⑴东巴象形文字是目前世界上仅存的为数不多的古象形文字之一,并且是世界上唯一仍在使用的古象形文字,是文字史上的活化。•⑵东巴象形文字在工艺美术设计具有很高的审美价值。第17周信息智能化加工思考:中国汉字的发展过程是怎么样的?第18周文本信息加工文字之旅:第1站——甲骨文龟壳兽骨3.文字之旅第18周文本信息加工金文文字之旅:第2站——金文第18周文本信息加工小篆大篆文字之旅:第3、4站——大篆、小篆第18周文本信息加工隶书(张迁碑)草书(张旭)行书(王羲之)文字之旅:第N站——隶书、草书、行书第18周文本信息加工4.书法是一种凝结了我国民族文化精髓的特殊的艺术形式兰亭集序(局部)晋·王羲之第18周文本信息加工徐冰—方块英文将26个字母改造成类似中国汉字的偏旁部首ArtForThePeople第18周文本信息加工Tiyanqingjing:pinyinyuhanzi体验情境:拼音与汉字村居(清)高鼎草长莺飞二月天,拂堤杨柳醉春烟。儿童散学归来早,忙趁东风放纸鸢。第18周文本信息加工计算机文字处理技术发展只能处理拉丁字母以及一些控制符号过去可处理包括象形文字在内的任何文字现在ASCII码(美国标准信息交换码),可以表示128个字符GB2312(1980年)一共收录了7445个字符Big5(1984),一共收录了13060个字符GBK1.0(1995),收录了21886个符号GB18030(2000),收录了27484个汉字和主要的少数民族文字Unicode(1994,统一码、万国码),它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。小结:从ASCII、GB2312到GBK1.0、GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。第18周文本信息加工中文信息处理技术发展简史20世纪80年代初,CCDOS成为我国第一个汉字操作系统;1983年,“王码五笔字型”输入法,突破了汉字数字化的瓶颈;1984年,联想公司成立并推出联想汉卡;1985年5月,北大方正研制的激光照排II型机,迎来了印刷业“告别铅与火,迈入光与电”的时代;1989年9月,金山公司发布了中文字处理系统WPS1.0;1992年,PTDOS1.0;1993年10月发布UCDOS3.0;1994年到1997年先后开发出UCDOS3.1~UCDOS7.0;1993年Windows3.2发布,这是第一个简体中文版的Windows操作系统,此后Windows及其中文版本不断升级;1999年,中国新一代的国产操作系统——红旗Linux推出。第18周文本信息加工1.历史上使用的文字处理技术手写刻字雕版印刷活字印刷机械式打字机计算机文字处理计算机文字处理只能处理英文可处理包括象形文字在内的任何文字如何在计算机中处理汉字?二、汉字的编码第18周文本信息加工2.汉字的编码目前计算机上使用的汉字编码主要有三种:输入码(外码)机内码(内码)输出码(字型码)用于输入汉字的编码用于存储汉字的编码用于输出汉字的编码区位码:4860全拼编码:xiong五笔字型:CEXO熊用机内码表示、存储如国标码(GB)和BIG5码用汉字字型输出汉字第18周文本信息加工输入码(外码):用于输入汉字,如区位码、拼音码、王码(五笔字型)、自然码等。机内码(内码):供计算机系统内部进行存储、加工处理、传输而统一使用的代码,用于储存汉字,如国标码(GB)、BIG5码等。输出码(字型码):存储在计算机内的汉字在屏幕上显示或打印机打印出来时,必须以汉字字型输出,汉字的输出码实际上是汉字的字型码,它是由汉字的字模信息所组成的。汉字是一种象形文字,每个汉字都是一个特定图形,这种图形可以用点阵、向量等方式表示。第18周文本信息加工字模(点阵、向量)如8*8点阵●●●●●●●●●●●●→00010000→00010000→11111110→10010010→11111110→00010000→00010000→00010000●●●●●●●●●●●●●●●●●●●●●●●●●Bit(位)Byte(字节)B1B=8bit1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB如32*32点阵就需要:32*32位=32*32/8B=128B用8*8点阵表示一个“中”字,这个汉字占8行,每一行8个点,其中每一个点用一个二进制位表示,值“0”表示没有笔形,值“1”表示有笔形,储存这个字型码需要8×8=64位二进制,即8个字节(1字节=8位二进制)。第18周文本信息加工计算机汉字的处理过程键盘输入(输入码)编码转换(机内码)编辑与输出(字型码)第18周文本信息加工例:“春”字在计算机中的处理过程1.从键盘用拼音输入法输入外码“chun”;2.从外码表中找出与之对应的汉字机内码;3.按照“机内码”找到存放字型码的地址;4.取出“字型码”在屏幕上显示出来。第17周信息智能化加工三、总结体验文字处理技术的发展变化及其意义;了解文字在计算机中的编码方式第18周文本信息加工判断(true/false)1.汉字起源于象形文字,至今仍保留了象形文字的特点。()2.TB,MB,GB,KB中数量级最大的是GB。()四、课堂过关练习TF第18周文本信息加工3.20世纪80年代初,我国第一个汉字操作系统是CCDOS,它的问世带动了中文软件平台的开发。()4.目前,计算机上汉字编码的形式主要有输入码、机外码和输出码三种。()5.计算机只能识别二进制数0和1代码。()TTF

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功