数字媒体及应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第5章数字媒体及应用5.1文本与文本处理5.2图像与图形5.3数字声音及应用5.4数字视频及应用2计算机应用的基础计算机应用:使用计算机进行信息处理其中,文字信息的处理是各种计算机应用的基础文字数值语言音乐图像···信息的形态有多种35.1文本与文本处理5.1.1字符的编码5.1.2文本准备5.1.3文本编辑、排版与处理5.1.4文本的展现5.1.5文本的分类与表示4计算机文本处理过程(文本编辑器)文本编辑与排版格式化的电子文本(2)文本存储与传输(4)文本展现(文本阅读器)(5)文本处理(文本处理软件)(3)文本准备电子文本(1)(文字与图表的输入)55.1.1字符在计算机中的表示6字符、字符集及其码表“字符”(character)字符集:一组特定字符的集合如:中文字符集、西文字符集、日文字符集等字符的编码:不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的码表7西文字符的编码——ASCII码采用7个二进位进行编码西文字符集:由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(简称ASCII码):能表示的字符数目是多少?在计算机中有多大存储空间存放一个字符?扩充ASCII码字符集8标准ASCII字符集及其码表b6b5b4b3b2b1b0012345670123456789ABCDEFb6b5b4b3b2b1b0011010011010119汉字如何编码?汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素汉字的特点数量大;多个国家和地区使用;字形复杂,同音字多,异体字多如何编码?确定收入多少字、哪些字?汉字在字符集中的排序方式确定使用的代码结构和代码空间10常用的汉字编码字符集国家标准GB2312…汉字扩充规范GBK国家标准GB18030台湾地区的标准汉字字符集CNS11643(BIG5,俗称“大五码”)日本工业标准汉字字符集JISX0208-90韩国国家标准汉字字符集KSC5601-8711一级汉字(3755个)二级汉字(3008个)(扩充使用)字母、数字和各种符号………………19423位号…………191655568794区号(按汉语拼音排列)(按偏旁部首排列)GB2312汉字编码字符集1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312GB2312字符集由三个部分构成:拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个所有符号分布在一个94行×94列的二维平面,每个汉字或符号都有一个确定位置,该位置的区号和位号就是这个汉字的“区位码”12区位码每一个汉字或符号在码表中的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示。如:“大”字的区号20,位号83,区位码是2083用2个字节表示为:000101000101001113国标交换码规定每个汉字的区号和位号必须分别加上32(即二进制00100000)。经过这样处理得到的代码称为汉字的“国标交换码”(简称交换码)。如:“大”字的交换码是00010100010100110010000000100000+001101000111001114机内码问题:汉字与西文字符如何存储?解决方法:把一个汉字看作两个扩展ASCII码,使汉字的两个字节的最高位(b7)都为“1”。------“机内码”,又称内码。如:“大”字的内码是:交换码:00110100011100111011010011110011(B4F3)15举例例如:“啊”区位码:1601=1001H=0001000000000001+3232+2020H+0010000000100000国标码:4833=3021H=0011000000100001+128128+8080H+1000000010000000机内码:176161=B0A1H=101100001010000116GB2312汉字的编码每一个GB2312汉字使用16位(2个字节)表示每个字节的最高位均为“1”在16位代码空间中的码位分布:第1字节第2字节007EA1FE0081A1FEGB2312图形符号汉字代码空间(6763个汉字)B0F716位的代码空间共有216=65536个码位17几种汉字编码的对比GB2312GBKGB18030UCS-2(Unicode)6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)27000多汉字(包括GBK汉字和CJK及其扩充中的汉字)2万多汉字双字节存储和表示,每个字节的最高位均为“1”双字节存储和表示,第1个字节的最高位必为“1”部分双字节、部分4字节表示(UTF-8编码)1字节、2字节、3字节等不等长编码编码不兼容!保持向下兼容GBK00FF00FF20902汉字00FF00FF6763汉字GB231200FF00FF27484汉字GB18030185.1.2文本准备——文稿如何输入计算机19文字符号输入计算机的方法键盘输入自动识别输入字符信息的输入人工输入(1)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等(3)字形编码,如五笔字形和表形码等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法20文字符号输入计算机的方法•优点:–自然,流畅–小型化,适合移动计算•不足:–识别速度和正确性还需提高–书写要求还要降低联机手写输入键盘输入自动识别输入字符信息的输入人工输入21文字符号输入计算机的方法语音输入•优点:•自然,方便,适合移动计算•不足:•对说话人、说话方式、说话内容的适应能力要大大增强•识别速度和正确性还需大大提高联机手写输入键盘输入自动识别输入字符信息的输入人工输入22文字符号输入计算机的方法印刷体识别扫描仪OCR数字文本纸介质文本文本的映象(image)语音输入联机手写输入键盘输入自动识别输入字符信息的输入人工输入•识别率已达到98%•功能:–简、繁体字混合识别–中文、西文混合识别–文字、表格混合识别–智能校对功能23文字符号输入计算机的方法手写体识别语音输入联机手写输入键盘输入自动识别输入字符信息的输入人工输入印刷体识别245.1.3文本的编辑与排版25复习:使用Word的操作流程创建新文档或打开老文档文稿输入编辑排版文档存盘、打印或发送输入中西文字、符号和图表进行增、删、改操作,保证文本的正确性满足清晰、美观、便于使用等要求skip26文本编辑和文本排版(格式化)1、编辑:对字、词、句和段落进行添加、删除、修改等操作。2、文本排版:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成3个层次。275.1.4文本的展现(输出)28文本的展现(输出)目的:阅读、浏览或打印文本使用的软件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word独立的软件:如Adobe公司的AcrobatReader,微软公司的IE等。文本展现的过程:1.对文本的格式描述进行解释2.生成文字和图表的映像(bitmap)3.传送到显示器或打印机输出29附:输出过程中字形的生成过程:先根据字符的字体确定相应的字库(font)再按照该字符的代码从字库中取出该字符的形状描述信息然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处。302种不同的字库点阵描述轮廓描述轮廓点直线二次曲线315.1.5文本的分类与表示32简单文本(纯文本)本书由南京大学出B1BECAE9D3C9C4CFBEA9B4F3D1A7B3F6版社(PublishingB0E6C9E7285075626C697368696E67HouseofNanjin20486F757365206F66204E616E6A696EgUniversity)出版6720556E697665727369747929B3F6B0E6文本的内容文本在计算机中的表示•由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息。•举例:33丰富格式文本本书由南京大学出版社(PublishingHouseofNanjingUniversity)出版•有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”•举例:•使用HTML语言描述为:palign=centerfontface=黑体本书由南京大学出版社/fontfontface=ArialBlack(PublishingHouseofNanjingUniversity)/fontfontface=黑体出版/font/p用一对指出的是标记,如fontface=“黑体”和/font等,用于说明排版的格式和文字属性,它们不属于正文内容正文内容34超文本若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成“超文本”ABCDEFGHa1a2b2c2f1d1c1b1e1g1h1a3“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频35文本的分类用途简单文本:网上聊天、短信、文字录入、OCR输入丰富格式文本(线性文本):公文、论文、书稿、网页丰富格式文本(超文本):网页、软件的联机文档(帮助文件)等36思考题英文字母“C”的十进制ASCII码值为67,则英文字母“G”的十六进制ASCII码值为__________输入码与机内码的关系是非题使用不同的输入编码方法向计算机输入的同一个汉字时,它们的编码不同,所以内码也不一样。5.2图像与图形5.2.1数字图像的获取5.2.2图像的表示与压缩编码5.2.3数字图像处理与应用5.2.4计算机图形385.2.1数字图像的获取39图像的获取过程扫描模拟图像取样取样取样数字图像分色量化量化量化从现实世界中获得数字图像的过程称为图像的“获取”常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等图像获取过程:将画面划分为M×N个网格,每个网格称为一个取样点将彩色图像取样点的颜色分解成R,G,B三个基色测量每个取样点的每个分量(基色)的亮度值对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示405.2.2图像的表示与压缩编码41数字(取样)图像的组成数字取样图像由M(列)×N(行)个取样点组成取样点是组成数字取样图像的基本单位,称为“像素”彩色图像的像素通常由3个彩色分量组成灰度图像和黑白图像的像素只包含1个亮度分量Red分量Green分量Blue分量42例1:黑白图像的表示黑白图像黑白图像的每个像素只有一个分量,且只用1个二进位表示,其取值仅“0”(黑)和“1”(白)两种43例2:灰度图像的表示灰度图像灰度图像的每个像素也只有一个分量,一般用8~12个二进位表示,其取值范围是:0~2n-1,可表示2n个不同的亮度44例3:彩色图像的表示蓝色分量绿色分量红色分量彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色45数字(取样)图像的主要参数图像大小(图像分辨率):用来表示组成该图像的行列数目,亦即图像所包含的像素数目使用水平分辨率x垂直分辨率表示对在屏幕上显示出来的大小有影响颜色空间的类型,指彩色图像所使用的颜色描述方法,如:RGB(红、绿、蓝)模型,显示器使用CMYK(青、品红、黄、黑)模型,彩色打印机使用HSB(色彩、饱和度、亮度)模型,用户界面中使用YUV(亮度、色度)模型,彩色电视信号传输时使用像素深度,即像素的所有颜色分量的二进位数目之和图像类型像素的组成像素深度(位数)颜色空间

1 / 130
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功