第2节各种媒体信息在计算机中的表示信息编码计算机中的信息是用二进制表示的。因为:物理上容易实现可靠性强运算简单通用性强在计算机中只能识别二进制数码信息,因此,一切字母、数字、符号、图像、声音等信息都必须用二进制特定编码来表示;信息才能传送、存储和处理信息的表示数值十/二进制转换西文字符ASCII码汉字输入码/机内码转换声音、图像模/数转换二/十进制转换西文字形码汉字字形码数/模转换内存输入设备输出设备数值西文汉字声音、图像信息编码信息的表示信息的存储单位……位二进制数位(bit)、字节(B)字节(8位)信息的表示信息的存储单位除字节外,还有千字节(KB)、兆字节(MB)、吉字节(GB)、太字节(TB),拍字节(PB)。它们的换算关系是:1KB=1024B=210BlMB=l024KB=210KB=220B1GB=l024MB=210MB=220KB=230B1TB=1024GB=210GB=220MB=230KB=240B1PB=1024TB=210TB=220GB=230MB=240KB=250B信息的表示计算机处理的信息除了数值数据以外,还有其他大量的非数值数据,非数值数据中主要是字符数据。由字符数据转换成二进制数值数据,最好的方法就是为字符编码,即对字符进行编号。每一个字符有一个唯一的编码。编码的方法:确定有多少字符需要进行编码对每一个字符进行编号一、字符数据的编码信息的表示ASCII(AmericanStandardCodeforInformationInterchange)码,即美国标准信息交换代码。规定了常用的数字、字符的编码。标准ASCII码是7位二进制编码,所以最多可以表示128个字符。在这种编码方案中,用八位二进制(一个字节)来存放一个字符,字节的最高位为0。——西文字符1、字符数据的编码信息的表示ASCII码表显示字符:范围为32~126,指那些能从键盘输入、显示器上显示或打印机上打印的字符。控制字符:范围是0~31,主要用来控制输入、输出设备或通信设备。控制字符显示字符ASCII码表的扩展ASCII码表中并没有列出所有人们希望处理的符号,比如德文中有字母ä就不在ASCII码的范围之内。扩展的ASCII码使用8位二进制编码,可以表示256个字符。其中0~127编码和标准ASCII一样,在编码范围128~255内,又增加了一些其它的字符,如特殊的德文字母和法文字母。(ISO-8859、ISO-8859-x)例子句子“Hello,World!”在计算机中如何表示?01001000011001010110110001101100011011110010110000100000010101110110111101110010011011000110010000100001ASCII编码很好地解决了英文等语言的字符问题,但是对汉语却没有解决。英文字符在计算机上的输入及输出也非常简单,因此,英文字符的输入、存储、内部处理都可以只用同一个编码(如ASCII码)。对于汉字而言,8位或者7位的编码空间远远不能解决问题,因为汉字有上万个,常用的也有六、七千个,128个或256个编码不够。因此在计算机中表示汉字,要采用另外的编码方案。2、字符数据的编码——汉字的编码要在计算机中处理汉字,必须解决以下几个问题1、首先是汉字的输入,即如何把结构复杂的方块汉字输入到计算机中去,这是汉字处理的关键;2、汉字在计算机内如何表示和存储?如何与西文兼容?3、如何将汉字的处理结果从计算机内输出?输入码国标码字形码机内码汉字输出汉字输入汉字编码转换过程汉字输入码为了将汉字通过键盘输入计算机而设计的编码称为汉字输入码,也称为汉字外部码,简称外码。音码类:全拼输入法、微软拼音、搜狗拼音和智能ABC等形码类:五笔字型法、郑码输入法等汉字国标码1980年,我国颁布了第一个汉字编码字符集标准,即GB2312-80《信息交换用汉字编码字符集基本集》,该标准编码简称国标码,是我国大陆地区及新加坡等海外华语区通用的汉字交换码。GB2312—80汉字6763个一级常用汉字3755个二级常用汉字3008个非汉字图形符号682个(汉字、字母、图形7445个)汉字的机内码汉字机内码是计算机系统内部对汉字进行存储、处理、传输统一使用的代码,又称为汉字内码。由于汉字数量多,一般用2个字节来存放汉字的内码。汉字机内码=汉字国标码+8080H汉字国标码汉字内码中8680(0101011001010000)B(1101011011010000)B华5942(0011101100101010)B(1011101110101010)B汉字字形码字形码是表示汉字字形信息(汉字的结构、形状、笔划等)的编码,用来实现计算机对汉字的输出(显示、打印)。在输出汉字时,计算机要先到字库中去找到它的字形描述信息,然后再把字形送去输出。汉字字形码de种类汉字字形码通常有:点阵和矢量两种表示方式点阵:汉字字形点阵的数字代码16×16、24×24、32×32、48×48矢量:存储的是描述汉字字形的轮廓特征的代码0000000110000000000000011000000000000001100000000000000110000000000000011000000000000001100000000000000110000000000000011000000011111111111111111111111111111111110000011000001111000001100000111100000110000011110000011000001111111111111111111111111111111111汉字的字形点阵表示字形码16×16点阵汉字汉字点阵字模的分类汉字的、、是计算机用于汉字输入、内部处理、输出三种不同用途的编码。练习1.字节是计算机中表示_______的基本单位。2.在计算机系统中,西文通常采用______编码。3.若1的ASCII码为(49)10,那么8的ASCII码为()105.国家标准字符集中收入的一级汉字共________个。6.1KB的内存空间可以存放______个汉字机内码。7.五笔字型属于________类输入编码。8.一个24*24点阵汉字需要________存储容量。A.72BB.36BC.32BD.64B二、图像与图形计算机中使用的图片有两种形式,即矢量图和位图,它们也是构成动画和视频的基础。图像(Image)图形(Graphic)位图矢量图矢量图形矢量图形指用计算机绘制的画面,是用一组绘制指令描述的。它不直接描述数据的每一点,而是描述产生这些点的过程及方法。这些指令给出了生成该图的所有直线、曲线、矩形、椭圆等各种图元的属性和参数,包括图形的位置、颜色、形状。位图图像位图也称为点阵图像。在计算机中的一幅位图图像可以理解为一个矩阵,该矩阵由若干个排列成行、列的点构成,这些点被称为像素。像素是构成位图图像的最小单位,它记录了图像中每一点上颜色、亮度等信息。图形与图像的比较图形放大图形与图像的比较图像图形占用存储空间大小表现内容细节较多,复杂的现实物体。细节相对较少,抽象/现实物体。放大/缩小将丢失其中的细节,并会呈现锯齿状放大不会失真计算机显示时间与文件大小有关图形色产生需要计算时间,图形越复杂,要求越高,所需时间也就越多。颜色数丰富,过渡均匀较少。构成像素构成、分辨率固定指令描述文件扩展名.bmp.gif.tif.jpg.jp2等.dwg.dxf.wmf等主要应用举例照片/GIF动画/网页/各种流程图、示意图/Flash动画分辨率与量化位数图像分辨率是指图像的水平方向和垂直方向的像素个数。–用来表示组成该图像的行列数目,亦即图像所包含的像素数目–使用水平分辨率x垂直分辨率表示一般来说,分辨率愈高,图像愈细腻,图像文件也越大。由于一幅位图的分辨率是确定的,所以对其进行放大时,会出现马赛克现象。x0y宽度方向:列高度方向:行若图像可出现的颜色数为8,则用3个二进制位表示:23=8(称为8色图像或3位图像)像素18765432彩色模拟图像图像量化位数是指图像中每个像素点记录颜色所用二进制数的位数,它规定了彩色图像中可出现的最多颜色数,或者灰度图像中的最大灰度等级数。往往把量化位数说成是图像深度或像素深度。表示一个像素的位数越多,能表达的颜色数目就越多。位图图像●图像由基本显示单元“像素”构成图像像点8bit(28=256色)16bit(216=65536色)24bit(224=16M色)●8位图像●16位图像●24位图像●像素由若干个二进制位进行描述●二进制位代表图像颜色的数量位图图像文件大小的计算数字图像数据量的计算公式(以字节为单位):文件字节数=水平分辨率×垂直分辨率×图像量化位数/8几种常用格式的图像的数据量:图像大小8位(256色)16位(65536色)24位(真彩色)640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1280×10241.25MB2.5MB3.75MB文件字节数=水平分辨率×垂直分辨率×量化位数/8例1:一幅像素为640×480的256色(8位)图像文件大小:640×480×8÷8≈300KB例2:一幅1024×768的RGB8:8:8真彩色图像文件大小1024×768×24/8≈2.4MB2.2视觉媒体技术有一幅未经压缩的图像,它的图像分辨率是400×300,其颜色深度是24,则这个文件的大小是?三、音频1、模拟信号在时间和幅度上都是连续的信号称为模拟信号。2、数字信号在时间和幅度上都是离散的信号称为数字信号。1.模拟音频的数字化用计算机对音频信息处理,就要将模拟信号(如语音、音乐等)转换成数字信号。采样--每隔一定时间间隔对模拟波形上取一个幅度值。量化--将每个采样点得到的幅度值以数字存储。编码--将采样和量化后的数字数据以一定的格式记录下来。模拟信号采样量化编码数字信号振幅频率1/T采样点T振幅1/TT(a)模拟音频信号(b)音频信号的采样(c)采样信号的量化数字化音频的过程如下图所示计算机导论声音数字化示意图声音进入计算机的第一步就是数字化,即把模拟信号转变成数字信号。连续的弯曲弧线代表模拟信号,而曲线上一个个点就是代表数字信号,用一点代替一段曲线,就是数字化过程.计算机导论声音1:采样频率22.05KHz,数字化16Bit,双声道录音。离散信号的信息与采样频率的关系(示例)声音1:采样频率1.38KHz,数字化16Bit,双声道录音。声音1:采样频率689Hz,数字化16Bit,双声道录音。