1第五章信息媒体的表示及数字化5.1计算机系统的信息表示与编码5.2媒体与多媒体信息5.3音频媒体的表示与数字化5.4图像媒体的表示与数字化5.5视频媒体的表示及数字化21.了解信息媒体的基本概念。2.掌握计算机系统的信息表示与编码。3.掌握信息媒体的分类与各种媒体的表示及数字化。二、重点、难点1.重点:多媒体概念;音频数字化;视频数字化;图像数字化;数据压缩编码。2.难点:数制之间相互转换。一、教学要求35.1计算机系统的信息表示与编码模拟与数字模拟数据(AnalogData)是随时间连续变化的值数字数据(DigitalData)则是模拟数据经量化后得到的离散的值4模/数转换:就是将连续变化的模拟信号转换为离散的数字信号,实现该功能的电路或器件称为模/数转换电路,通常称为A/D转换器或ADC(AnalogDigitalConverter)。数/模转换:是模/数转换的逆过程,就是将离散的数字信号转换为连续变化的模拟信号,实现该功能的电路或器件称为数模转换电路,通常称为D/A转换器或DAC(DigitalAnalogConverter)。5.1计算机系统的信息表示与编码5模拟技术和数字技术的比较让我们以水桶为例比较这两种方法。为表示数字系统,我们假定用一个空桶表示0,用一个有水的桶表示1。表示一个数字值时,我们采用浮点记数法,用一个桶表示一个二进制位。相对而言,为表示模拟系统,我们用一个桶来表示一个值,其值由桶里水的高度指示。6信息在计算机中的表示“0和1”的世界─计算机为什么采用二进制容易表示运算简单7数在计算机内的表示方法数在计算机内的表示,要涉及到数的长度和符号如何确定、小数点如何表示等问题。由于二进制数的每一位数(0或1)是用电子器件的两种稳定状态来表示的,因此,二进制位(bit)是最小信息单位,一个数的长度按二进制位数(即bit数)来计算。8计算机中信息的存储单位在计算机内,各种信息都是以二进制码形式来描述、存储。存储就有量的大小,信息存储的单位就使用一些量来描述。①位(bit)位是度量数据的最小单位,表示一位二进制信息。②字节(byte)我们前面介绍的存储器的容量、硬盘的大小、内存的大小、光盘的容量等都是以多少字节来表示的,常用的单位有:B1B=8bitKB1KB=1024ByteMB1MB=1024KBGB1GB=1024MBTB1TB=1024GB9信息的编码1.ASCII码2.中文信息编码及标准3.信息时代的“书同文、字同码”──Unicode10目前计算机中用得最广泛的字符集及其编码,是由美国国家标准局(ANSI)制定的ASCII码(AmericanStandardCodeforInformationInterchange,美国标准信息交换码),它已被国际标准化组织(ISO)定为国际标准,称为ISO646标准。适用于所有拉丁文字字母,ASCII码有7位码和8位码两种形式注意:在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。1.ASCII码11标准ASCII码是用一个7位二进制数来编码,用8位二进制来表示(8位二进制数就是一个字节),其最高位为0,7位二进制数总共可编出27=128个码,每个码表示一个字符,一共可以表示128个符号。扩展的ASCII码是8位的二进制数,正好用一个字节来表示。总共有28=256个码,可以表示256个符号。除了用128表示标准ASCII码所表示的符号外,另外128个码用于表示一些花纹、图案符号。1.ASCII码12132.中文信息编码标准GB2312-1980是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集——基本集》,由国家标准总局发布。GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个。GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示”。GBK-1995,为了解决汉字太少问题,以及配合UNICODE的实施,全国信息技术化技术委员会于1995年12月1日形成的《汉字内码扩展规范》。GBK向下与GB2312完全兼容,向上支持ISO10646国际标准。GBK亦采用双字节表示,共收入21886个汉字和图形符号。GB18030-2000是最新的汉字编码字符集国家标准,向下兼容GBK和GB2312标准。GB18030编码是一二四字节变长编码。也就是说,GB18030编码在码位空间上做到了与Unicode标准一一对应,这一点与UTF-8编码类似。共收入27484个汉字。14数制的基及其表示数制的基把任何数表示为某一特定数字(数基)的幂的和我们通常使用的基为十的数系叫做十进制数系,基为二就叫做二进制数系。由于各数制的数码有重叠,为了不产生混淆,各数制的数分别加不同的角标以示区别:二进制:B(Binary),如(11101)B;八进制:O(Octal),如(35)O;十六进制:H(Hexadecimal),如(1D)H;15几种常见数制之间的转换(1)R进制转换为十进制(1)R进制转换为十进制基数为R的数字,只要将各位数字与它的权相乘,然后将其按“逢十进一”相加,其和就是一个十进制数。进制之间的转换16进制之间的转换(2)十进制转换成R进将十进制转换成R进制时,将整数部份和小数部份分别转换,然后再将整数部份与小数部分转换的结果相加起来。这里主要介绍十进制转换成二进制。17进制之间的转换(2)十进制转换成R进制十进制小数转换成R进制时,可连续地乘以R,直到小数部分为0,或达到所要求的精度为止(小数部分可能永远不为0)得到的整数即组成R进制的小数部分,此法称“乘R取整”。18进制之间的转换(3)八,十六进制的相互转换由于二位,八位,十六位这三种进制数的权之间有一定的内在联系,即23=8、24=16,故其之间的转换比较容易。即每一位八进制数相当于三位二进制数,每一位十六进制数相当于四位二进制数。在由二进制转换为八进制时,以小数点为中心向左右两边延伸,每三位为一组,中间的0不省,到了两头不够一组时用0补足位数,算出每一组相对应的十进制数,然后将这些十进制数组合起来就成了一个八进制数。例:将(11101.00101)2转换成八进制数。19进制之间的转换(3)八,十六进制的相互转换20计算机的逻辑运算与逻辑门电路逻辑或运算逻辑与运算21逻辑非运算异或运算0计算机的逻辑运算与逻辑门电路225.2媒体与多媒体信息一、媒体的分类按国际电信联盟(IUT)下属的国际电报电话咨询委员会(CCITT)的定义,媒体可分为以下五种,如图5-8所示。231.感觉媒体(Perception):感觉媒体就是指能直接作用于人的感官,使人能直接产生感觉的一类媒体。如:声音、图像、文字、气味以及物体的质地、形状、温度等。2.表示媒体(Presentation):它是为了能更有效地加工、处理和传输感觉媒体而人为研究和构造出来的一种媒体。例如:语音编码、静态和活动图像编码以及文本编码等都称为表示媒体。一、媒体的分类243.显示媒体(Display):是指感觉媒体和用于通信的电信号之间转换用的一类媒体,可分为输入显示媒体(如键盘、摄像机、话筒、扫描仪等)和输出显示媒体(如显示器、发光二极管、打印机等)两种。4.存储媒体(Storage):是用于存放数字化的表示媒体的存储介质。如磁盘、光盘、半导体存储器等。5.传输媒体(Transmission):用来将表示媒体从一处传递到另一处的物理传输介质。如同轴电缆、双绞线、光线、及其他通信信道。一、媒体的分类25二、媒体与多媒体通常所指的多媒体就是感觉媒体的组合,即声音、图像、图形、动画、文字、数据、文件等多种媒体的组合。从广义上来讲,多媒体一词是指多种信息媒体的表现和传播形式。从狭义的角度来看,多媒体是指人们用计算机及其它设备交互处理多媒体信息的方法和手段,或指在计算机中处理多种媒体的一系列技术。这其中有几层含义:指媒体的表现形式,如数值、文字、声音、图像、视频。指处理多媒体的声卡、视频卡、DSP芯片等硬件设备。指用以存储信息的实体,如光盘、磁带、半导体存储器等。26•多媒体技术:是一种基于计算机科学的综合技术,它包括数字化信息处理技术、音频和视频技术、计算机软硬件技术、人工智能和模式识别技术、通信和网络技术等。或者说,所谓多媒体技术是以计算机为中心,把语音、图像处理技术和视频技术等集成在一起的技术。具有这种功能的计算机称为多媒体计算机。27多媒体技术有以下几个主要特点:(1)集成性:能够对信息进行多通道统一获取、存储、组织与合成。(2)控制性:多媒体技术是以计算机为中心,综合处理和控制多媒体信息,并按人的要求以多种媒体形式表现出来,同时作用于人的多种感官。(3)交互性:交互性是多媒体应用有别于传统信息交流媒体的主要特点之一。传统信息交流媒体只能单向地、被动地传播信息,而多媒体技术则可以实现人对信息的主动选择和控制。三、多媒体类型及特点28(4)非线性:多媒体技术的非线性特点将改变人们传统循序性的读写模式。以往人们读写方式大都采用章、节、页的框架,循序渐进地获取知识,而多媒体技术将借助超文本链接(HyperTextLink)的方法,把内容以一种更灵活、更具变化的方式呈现给读者。(5)实时性:当用户给出操作命令时,相应的多媒体信息都能够得到实时动态的控制。(6)信息使用的方便性:用户可以按照自己的需要、兴趣、任务要求、偏爱和认知特点来使用信息,任取图、文、声等信息表现形式。(7)信息结构的动态性:“多媒体是一部永远读不完的书”,用户可以按照自己的目的和认知特征重新组织信息,增加、删除或修改节点,重新建立链。三、多媒体类型及特点295.3音频媒体的表示与数字化音频信号记录的历史19世纪爱迪生发明了留声机(图5-9)音频信息在多媒体中的应用是极为广泛的,当计算机配有声卡和音箱后(图5-10),就能够发出各种悦耳的声音30音频信号的形式在物理上,声音可用一条连续的曲线来表示。这条连续的曲线无论多复杂,都可分解成一系列正弦波的线性叠加。规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波.由于声波是在时间和幅度上都连续变化的量,我们称之为模拟量。3132模拟音频信号的物理特征模拟音频信号有两个重要参数:频率和幅度。声音的频率体现音调的高低,声波幅度的大小体现声音的强弱。一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。人们在日常说话时的语音信号频率范围在300Hz-3000Hz之间。频率小于20Hz的信号称为亚音(subsonic);频率范围为20Hz-20kHz的信号称为音频(Audio),高于20kHz的信号称为超音频(ultrasonic)。33与频率相关的一个参数是信号的周期(图5-12)。它是指信号在两个峰点或谷底之间的相对时间。周期和频率之间的关系是互为倒数。信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音频信号,声音的强度用分贝(dB)表示,分贝的幅度就是音量。34音频的数字化过程对模拟音频数字化过程涉及到音频的采样、量化和编码,如图5-13所示。1.声音的采样2.音频的量化3.数字音频的编码35不同音频编码特点分析1、MP3MP3为MPEGAudioLayer3的缩写,是由ISO/MPEG语音编码标(AudioCodingStandard)所制定的一种声音压缩技术,压缩比是CD的1:10到1:12,采样率为44kHz、比特率为112kbit/s。MP3音乐是以数字方式储存的音乐,如果要播放,就必须有相应的数字解码播放系统,一般通过专门的软件进行MP3数字音乐的解码,再还原成波形声音信号播放输出,这种软件就称为MP3播放器,如Winamp等。362、ASXASX文件是一个文本文件,主要目的是