《计算机应用基础》2006版袁圣汉主讲上海师范大学计算中心第三章多媒体技术3.1多媒体技术基本概念3.2多媒体信息的数字化3.3数字音频技术概述3.4图像处理3.5动画制作3.6视频信息的处理技术3.7多媒体技术的应用及前景3.1多媒体技术基本概念3.1.1多媒体定义3.1.2多媒体计算机技术的特性3.1.3多媒体关键技术3.1.1多媒体定义媒体是信息的载体,是表达各种信息时所采用的介质或形式。它的作用是存储、表达及传送信息。多媒体的两大特征是:一是多种媒体形式并存;二是强大的交互功能。多媒体技术是指能够同时获取、处理、编辑、存储和展示两个以上不同类型信息媒体的技术。多媒体技术使信息传播技术、信息处理技术和信息存储技术的综合,它被看成是先进的计算机技术与视频、音频和通信技术融为一体的新技术。3.1.2多媒体计算机技术的特性集成性交互性实时性多样性。3.1.3多媒体关键技术---1数据压缩和编码技术多媒体数据压缩编码技术是解决大数据量存储与传输问题的行之有效的方法。压缩方法根据不同的依据可产生不同的分类:根据压缩质量有无损失可分为有损压缩、无损压缩;根据是否自适应可分为自适应性编码、非适应性编码等。超大规模集成(VLSI)电路制造技术VLSI技术的进步使得生产低廉的数字信号处理器(DSP)芯片成为可能,进而为多媒体技术的普及带来了乐观的前景。大容量的光盘存储技术多媒体同步技术多媒体同步技术可以理解为在时间空间上对多媒体对象的协调、规划和展示技术,此过程将体现在处理多媒体数据的全过程(包括采集,表示,传输,播放等)中,并将涉及多媒体对象的同步关系描述和同步控制机制两方面内容。3.1.3多媒体关键技术--2多媒体网络技术多媒体的发展必然要与计算机网络技术相结合,以便使丰富的多媒体信息得以共享。多媒体信息检索技术基于特征的多媒体信息检索技术有着广阔的应用前景,它将广泛用于远程教学、远程医疗、电子会议、电子图书馆、艺术收藏和博物馆管理、地理信息系统、遥感和地球资源管理、计算机支持协同工作等方面。虚拟现实技术虚拟现实(VirtualReality,VR)是多媒体技术的最高境界,也是当今计算机科学中最尖端的课题。虚拟现实是计算机硬件技术、软件技术、传感技术、人工智能及心理学等技术的综合。3.2多媒体信息的数字化3.2.1图形图像的数字化和存储3.2.2音频信息的数字化和存储3.2.3视频信息的数字化和存储3.2.1图形图像的数字化和存储图像的采样图像采样就是把图像分割成为一系列小区域,用特定的数值来表示每一个小区域的亮度、色彩等特征。获取图像常用到数码相机、扫描仪或用专用软件创建图像等。在进行采样时,采样频率是影响图像质量的重要指标。采样频率是指一秒钟内采样的次数图像的量化采样后得到的亮度值(或色彩值)在取值空间上仍然是连续值。把这些连续量表示的像素值离散化为整数值的操作叫量化。图像的编码与压缩图像的编码,就是按照一定的格式把图像经过采样和量化得到的离散数据记录下来。压缩编码技术是实现图像传输与存储的关键,常用的图像压缩编码有预测编码和变换编码。3.2.2音频信息的数字化和存储对模拟音频的数字化的过程涉及到音频的采样、量化和编码。声音的采样采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。计算机获取声音的主要设备是声卡。声音的量化采样所得到的声波上的幅度值,影响音量的高低,该值的大小需要用某种数字化的方法来表示。通常把对声波波形幅度的数字化表示称之为量化(quantization)。采样信号的量化值采用二进制表示,表示样信号的幅度二进制的位数称量化位数。声音的采样和量化工作都是由声卡完成的声音的编码和存储编码就是用相应位数的二进制符号来表示已经量化的采样值。音频信号编码常用的是波形编码方法3.2.3视频信息的数字化和存储--1视频的概念视频(Video)是由一幅幅单独的画面序列组成的,每一幅画面称为一帧(frame)视频的分类:模拟视频(AnalogVideo)、数字视频(DigitalVideo-DV)。色彩的空间表示各种模拟设备以及多媒体计算机由不同的色彩空间表示方法。其中常用的色彩空间表示由RGB、YUV、YIQ三种。3.2.3视频信息的数字化和存储---2视频信息的采样视频信号只有通过视频采集卡才能将静态或动态的模拟信号转换成数字信息。视频信息的量化采样是把模拟信号变成了时间上离散的脉冲信号,而量化则是进行幅度上的离散化处理。视频信息的编码编码技术主要分成帧内编码和帧间编码,前者用于去掉图像的空间冗余信息,后者用于去除图像的时间冗余信息。3.3数字音频技术概述3.3.1声音的概念3.3.2音频数据的压缩3.3.3音频数据的处理3.3.4主要的声音文件的格式3.3.5音频数据的编辑3.3.1声音的概念在多媒体系统中,声音是一种机械振动状态的传播现象,它表现为一种机械被即声波。可通过振幅(Amplitude)、周期(Period)与频率(Frequency)来表示波形声音。周期:两个相邻信号波峰之间的时间间隔。振幅:波形顶峰(或低点)与基准线的距离。频率:每秒钟内波峰的数目或周期数量(单位Hz)。声音的三要素:音调、音强和音色。音调:与声音的频率有关,频率高则声音高,频率低则声音低。音强:又称响度,取决于声音的幅度。也即振幅决定声音的大小和强弱。音色:由混入基音的泛音所决定的。3.3.2音频数据的压缩音频信号的压缩编码方法可分为有损压缩和无损压缩,有损压缩又分为波形编码、参数编码和同时利用前者两种技术的混合编码。音频信号编码常用的是波形编码中的PCM(脉冲编码调制)方法在脉冲编码调制的方法中,有差分脉冲调制(DifferentialPulseCodeModulation,简称DPCM)方法和自适应差分脉冲调制(AdaptiveDifferentialPulseCodeModulation,简称ADPCM)方法。3.3.3音频数据的处理多媒体电脑产生声音的方式主要有三种:由外部声音源进行录制与重放、MIDI声音和CD-Audio。分别称为波形音频、MIDI音频和CD音频。Windows所使用的标准数字音频称为波形文件(扩展名.WAV),记录了对实际声音进行采样的数据。MIDI是乐器数字接口(MusicalInstrumentDigitalInterface)的缩写。MIDI是用于在音乐合成器、乐器、和计算机之间交换音乐信息的一种标准协议,通过它可以把音乐合成器及相关设备连接到计算机上进行音乐创作。MIDI设备有三种端口:MIDIIn(输入口)——用于接收其他MIDI设备送来的MIDI信息;MIDIOut(输出口)——用于发送设备生成的原始的MIDI信息;MIDIThru(转送口)——用于向其他连接MIDI的设备传送从MIDIIn端口接受到的信息。合成器产生MIDI乐音的方法很多,常用的有:一种是频率调制合成法,采用频率调制的原理产生声音,用以模拟各种乐器声音;另一种是乐音样本合成法,也称为波形表合成法,MIDI的优点:生成的文件小3.3.4主要的声音文件的格式Wave:是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。MIDI:是MusicalInstrumentDigitalInterface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。CD音频:CD音乐格式,扩展名CDA,其取样频率为44.1kHz,16位量化位数MP3:全称是MPEG-1AudioLayer3,它在1992年合并至MPEG规范中。MP3能够以高音质、低采样率对数字音频文件进行压缩。另外常见的声音格式还有RealNetworks公司的RealAudio、微软的WMA(WindowsMediaAudio)、瑞典Coding科技公司开发的MP3Pro、苹果公司的QuickTime、新一代的数字音频格式DVDAudio以及VOC、AU、AIFF等。3.3.5音频数据的编辑录音与保存操作实例1:利用WindowsXP中的“录音机”工具录制一段声音,保存到“我的文档”下的“我的音乐”文件夹中,取名为ly.wav。定位、剪辑和混音操作实例2:利用录音机工具,打开配套光盘中的M1.WAV文件,在该文件的1秒处,混入M2.WAV文件,并使音乐总长为5.5秒,删去其余的音乐。以M1.WAV为文件名,格式为IMAADPCM,8.000KHz,4位,立体声,保存到A盘根目录下。3.4图像处理3.4.1图像文件格式3.4.2图像压缩3.4.3数字图像的获取3.4.4Photoshop基本操作3.4.1图像文件格式一、位图图像和矢量图形二、图像文件格式一、位图图像和矢量图形1.位图图像位图图像也叫作栅格图像,是用小的方形网格,即像素来代表图像的。在表现阴影和色彩(如在照片或绘画图像中)的细微变化方面,位图图像有很好的表现效果,因此位图图像常用于照片或绘画图像中。但是位图图像存在一个缺点,既文件尺寸较大。2.矢量图形矢量图形是由叫作矢量的数学对象所定义的直线和曲线组成的。矢量根据图形的几何特性来对其进行描述。矢量图形是文字(尤其是小字)和粗放图形的最佳选择。矢量图形占有的空间较小,但是由于矢量图形主要由线条和颜色块组成,所以不适合用来表现色彩变化丰富,色调变化复杂的图像。一、位图图像和矢量图形原图放大后的位图放大后的矢量图一、位图图像和矢量图形二、图像文件格式图像格式是指计算机中存储图像文件的方法,它们代表不同的图像信息——矢量图形还是位图图像、色彩数和压缩程度。图形图像处理软件通常会提供多种图像文件格式,每一种格式都有它的特点和用途。在选择输出的图像文件格式时,应考虑图像的应用目的以及图像文件格式对图像数据类型的要求。二、图像文件格式PSD格式BMP格式JPEG格式TIF格式GIF格式PNG格式WMF格式3.4.2图像压缩图像中包含一定的数据冗余:首先,由于相邻像素之间的相关性,图像包含相当高的空间冗余度;其次,由于图像中不同色彩组成部分的相关性,它也包含一定程度的色谱冗余度。正是由于冗余的存在,才使图像压缩成为可能。3.4.2图像压缩图像压缩方法分为两类:有损压缩有损压缩允许图像在压缩前和解压缩后有一定程度的不同。无损压缩无损压缩要求图像在压缩前和解压缩后应该完全一样,不允许有一位的差错。一、无损压缩优点能够比较好地保存图像的质量缺点相对有损压缩而言无损压缩的压缩率比较低,一般只有2:1到4:1。常用的无损压缩方法有RLE(行程长度受限编码)、霍夫曼压缩编码、LZW压缩方法等。RLE(行程长度受限编码)是一种对图像进行无损压缩的最简单的方法。其基本思想是:把图像数据按某种方式(如一行接一行)排列成一个一维的数据序列,然后从序列的开头开始编码,每遇到一串相同的数据就用该数据及其重复的次数来代替原来的串。例如,100个连续的0,可以表示为0与100两个数。这种方法能压缩图像中连续的相同颜色造成的相关性,适用于压缩具有较大区域同色色块的图像。二、有损压缩有损压缩应用于一般图像,如风景,人物照片,部分医疗图像等。优点有损压缩的压缩比很高,能达到10:1,20:1,甚至到40:1。缺点图像质量不够好。JPEG是一种常用的有损压缩技术,其压缩原理是根据重要等级分离图像中的信息,然后在存储时去掉一些不太重要的信息,只保留重要的数据。3.4.3数字图像的获取扫描仪数码相机3.4.4Photoshop基本操作Photoshop是由Adobe公司开发的图形处理系列软件之一,是主要应用于图像处理、广告设计等方面的一个电脑软件。该软件具有界面友好、图像处理功能强大