多媒体技术基础1.1多媒体技术的形成和发展一、什么是多媒体?(理解)文本、声音、图形、图象和动画等是信息的载体,其中两个或多于两个的组合构成了多媒体。多媒体技术内容:(理解)多媒体技术:运用计算机综合处理多媒体信息(文本、声音、图形、图像等)的技术,包括将多种信息建立逻辑连接,进而集成一个具有交互性的系统等等。二、多媒体技术的特性(了解)(1)集成性(2)实时性(3)交互性(4)高质量三、促进多媒体技术发展的关键技术(了解)1、CD--ROM2、高速计算机网络3、高速位处理技术、专用集成电路技术和亚微米集成电路技术4、多媒体压缩技术、人机交互技术和分布式技术二、多媒体技术的发展过程及应用(了解)1、启蒙发展阶段2、初期应用和标准化阶段在我国,多媒体技术和应用的发展始于20世纪80年代。1.2多媒体技术的分类(了解)按功能和应用分类:1、基于功能的分类(1)开发系统(2)演示系统(3)培训系统(4)家庭系统2、基于应用的分类:(1)多媒体信息咨询系统(2)多媒体管理系统(3)多媒体辅助教育系统(4)多媒体通信系统(5)多媒体娱乐系统1.3多媒体系统的组成(理解)1、计算机硬件2、多媒体计算机所配置的硬件3、多媒体I/O控制及接口4、多媒体的核心系统5、创作系统6、应用系统1.4多媒体网络应用技术(了解)1、局域网定义:局域网LAN(LocalAreaNetwork)能够“把分散在一个建筑物或相邻几个建筑物中的计算机、终端、带大容量存储器的外围设备、控制器、显示器以及连接其他网络而使用的网络连接器等相互连接起来,以很高的速率(1~20Mbps)进行通信”。功能(从应用角度):(1)设备共享(2)信息共享(3)可进行高速数据通信,进行多种媒体信息的通信(4)分布式处理(5)提高兼容性(6)安全性2、广域网定义:WAN即WideAreaNetwork是在较大地理范围内将计算机连接起来的计算机网络。3、因特网(1)internet的发展(2)internet提供的服务方式基本服务方式(电子邮件、文件传输、远程登录)扩展服务方式第二章多媒体信息的表示与压缩2.1文字一、西文(ASCII码)二、汉字(数字编码、拼音码、字型编码)2.2音频(Audio)定义:20HZ~20KHZ的音频范围分类:波形声音、语音、音乐声音三要素:音调、音强、音色一、数字音频音频数字化:把模拟音频信号转换成有限个数字表示的离散序列。转换过程:选择采样频率,进行采样选择分辨率,进行量化形成声音文件数字录音文件大小的计算:S=R×D×(r/8)×1S以字节为单位声音文件的格式:WAV(waveform)au(audio)AIF(AudioInterchangeableFileFormat)snd(sound)为扩展名的文件格式VOC、MIDI、SNO、RMI文件1、WAV文件存储容量大2、VOC文件3、MIDI文件用于音乐,与WAV文件不同二、乐器数字接口(MIDI)MIDI信息实际上是一段音乐的描述,只记录产生某种声音的指令,指令中包括了使用MIDI设备的音乐、音量和持续时间长短信息。是数字化的乐谱,由音符序列、定时及合成音色的乐器定义组成。三、数字化声音和MIDI的比较MIDI信息实际上就是乐谱的数字表示。与波形声音相比,MIDI数据不是声音而是指令,因此它的数据量要比波形声音少的多。对MIDI的编辑很灵活,可以自由地改变曲调、音色等属性,波形声音就很难做到这点。波形声音与设备有关,MIDI数据与设备有关,即MIDI音乐文件所产生的声音与用来回放的特定的设备有关。数字化声音最重要的优点就是重放质量的一致性、可靠性比较好,可自始至终保证质量。2.3视觉媒体计算机的图形、图像均为视觉媒体表示方式:位图表示、矢量表示、曲线表示(动态图像)、符号表示一、图形、图像文件格式DIB、BMP、PCX、TIFF等二、位图又称点阵图,是一种写实的手法。能够忠实地记录图像中每一个象素的颜色和位置三、矢量图四、矢量图与位图的比较1、概念上:矢量图(图形)一般指计算机绘制的画面,如直线、圆、圆弧、任意曲线和图表等图像是指由输入设备捕捉的实际场景画面或以数字化形式存储的任意画面。2、存储容量大小图像是由一些排成行列的像素组成的,在计算机中的存储格式有BMP、TIF、GIFD等。一般数据量比较大。除了可以表达真实的相片,也可以表现复杂绘画的某些细节,具有灵活和富于创造力等特点。在打印输出和放大时,容易发生失真。图形也称矢量图文件中只记录生成图的算法和图上的某些特征点,容易进行移动、缩放、旋转和扭曲等变换,主要用于表示线框型的图画、工程制图、美术字等。常用的矢量图文件有3DS(用于3D造型)、DXF(用于CAD)、WMF(用于桌面出版)等。图形只保存算法和特征点,相对于位图的大数据量来说,它占用的存储空间也比较小。但是显示速度没有图像快,打印输出和放大时,质量较高不会发生很大失真。五、监视器与颜色监视器的分辨率分类:屏幕分辨率图像分辨率像素分辨率2.4动画(animation)定义:指运动的画面。利用快速变换帧的内容达到运动的效果。制作工具:animation、Flash、3Dmax等视觉暂留计算机动画设计主要是为了能够生成和处理一连串的静态画面,并通过高速放映来欺骗人的眼睛,使人们相信屏幕上的画面是动态的。计算机实现动画的两种方法造型动画:对每一个活动的对象分别进行设计,并构造每一对象的特征,然后用这些对象组成完整的画面,进行实时转换,形成动画。帧动画是由一幅幅连续的画面组成的画像或图形序列动画和视频是连续渐变的静态图像或图形序列,沿时间轴顺次更换显示,从而构成运动视觉的媒体。动画:序列中每帧图像是人工或计算机产生的图像。视频:序列中每帧图像是通过实时摄取自然景象或活动对象。动画技术参数帧速度数据量图象质量2.5超文本和超媒体定义:超文本:由信息结点和表示结点间相关性的链构成的一个具有一定逻辑结构和语义的网络。超媒体:多媒体+超文本超文本主要成分:结点和表示结点间关系的链超文本系统的三层模型:数据库层超文本抽象机层用户接口层2.6数据压缩多媒体冗余信息:空域相关时域相关视觉掩盖效应数字压缩技术三个重要指标1、信息存储量之比大2、压缩的算法简单3、恢复效果好基本原理压缩编码:冗余压缩法(无损压缩法或熵编码)有损压缩法(熵压缩法)(一)变长编码1、Huffman编码定义:对统计独立信源达到最小平均码长的编码方法,具有惟一可译性。基本原理:按信源符号出现的概率大小进行排序,出现概率大的分配短码,出现概率小的则分配长码。编码过程(1)将信源符号按概率递减顺序排列;(2)把两个最小的概率加起来,作为新符号的概率;(3)重复(1)和(2),直到概率和达到1为止;(4)在每次合并消息时,将被合并的消息赋予1和0或0和1;(5)寻找从每一信源符号到概率为1的路径,记录下路径上的1和0(6)对每一符号写出从码树的根到终结点1、0序列2、算术编码定义:是一种二元码的编码方法,在不考虑信源统计的情况下,只要监视一小段时间内码出现的频率,不管统计是平稳的或非平稳的,编码的码率总能趋近于信源熵值,每次迭代时的编码算法只处理一个数据符号,并且只有算术运算。原理:也是一种统计编码,每个符号对应0到1上的一段子区间,区间长度为该符号出现的概率。该方法将被编码的符号串(数值串)表示成实数0到1之间的一个区间。初始把它设为整个区间。当出现一个新的待编码符号,先把完整的0到1区间映射到上一次形成的区间,然后新区间取为0到1上的新符号对应区间所映成的像。解码时,根据区间的覆盖性来逐一解出原符号串。预测编码:根据某一数据模型利用以往的样本值对新样本值进行预测,然后将样本实际值与预测值的差值进行编码。如果模型足够好,且样本序列的时间相关性较强,那么误差信号的幅度将远小于原始信号,可以用较少的值对其差值量化,得到较好的压缩效果。预测编码常用的是差分脉冲编码调制(DPCM)和自适应的差分脉冲编码调制(ADPCM)。变换编码:是将通常在空间域描写的图像信号,变换到另外一些正交矢量空间(即变换域)中进行描写,而且通过选择合适的变换关系使变换域中描写的各信号分量之间相关性很小或者互不相关,从而达到数据压缩的目的。模型编码:是指采用模型的方法对传输的图像进行参数估测。典型的有分形编码。2.7音频信号的压缩编码一、音频信号编码基础音频冗余主要表现为:时域冗余度频域冗余度音频信号的编码方式:(1)波形编码,如PCM、APC、ATC等(2)分析合成方法(参数编码方法)如PLC(3)混合编码方法2.8视频信号的压缩编码一、视频信号的压缩编码分类无损压缩:利用数据的统计特性来进行数据压缩,典型的编码:Huffman编码、算术编码等。不失真压缩比低有损压缩:利用人的视觉特性使解压缩后的图像看起来与原始图像一样。压缩比高如:预测编码、变换编码、模型编码及混合编码等。二、视频信号压缩编码的标准JPEG静止图像压缩算法MPEG运动图像压缩算法视频压缩方式(补充):MicosoftVideo1:使用8位有损压缩方法压缩模拟视频。它压缩后的动画尺寸大,而且在进行渐变色处理时会出现条纹。INDEO:是专门处理局部动态影像和色彩、画质细腻的静态图像的压缩编码技术,压缩比低,且需要较高速的CPU才能确保播放品质。处理渐变色和火焰效果时会有严重的马赛克。RadiusCinepak:这种有损压缩方法最初用于压缩24位视频,从而在CD-ROM驱动器上播放,图像质量好,播放速度快,能压缩成黑白动画。它的特点是压缩后尺寸小,渐变色外理时不会出现条玟和马赛克,压缩后火焰效果也不会出现马赛克。但如果使用贴图背景,背景会比较粗糙。FullFrames:在将动画信息以数据流形式存储时,这种方法质量高并得到普便使用。这种方法形成的AVI文件需要大量的硬盘空间,但可为动画提供高质量的单个连续文件。因为它适合于很多机器类型并与桌面视频应用程序兼容,对交互式多媒体产品,是十分有效的。JPEG和MPEG的差别MPEG视频压缩技术是针对运动图像的数据压缩技术。为了提高压缩比,帧内图像数据和帧间图像数据压缩技术必须同时使用。MPEG通过帧运动补偿有效地压缩了数据的比特数,它采用了三种图像,帧内图、预测图和双向预测图。有效地减少了冗余信息。对于MPEG来说,帧间数据压缩、运动补偿和双向预测,这是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT帧内图像数据压缩编码。另外,MPEG中视频信号包含有静止画面(帧内图)和运动信息(帧间预测图)等不同的内容,量化器的设计比JPEG压缩算法中量化器的设计考虑的因素要多。关于压缩比衡量一个压缩算法好坏的标准,除了解压后的数据有无失真或失真程度之外,是看压缩比的大小。压缩比常用的定义有两种:(1)采样压缩比(2)比特压缩比数字视频的制式PAL制式NTSC制式影响数字视频质量的因素(1)帧速(2)分辨率(3)颜色数(4)压缩比(5)关键帧三、多媒体制作一、多媒体应用系统开发的一般步骤(1)确定开发对象(2)明确开发方法(3)准备多媒体数据(4)集成一个多媒体系统二、多媒体数据制作概念根据多媒体应用系统的需要,制作数字音频、数字图像、动画等文件,完成应用系统的多媒体数据准备工作。3.1数字音频的制作一、数字音频的制作过程1、音频概述声波的表示方法2、数字音频的录制准备步骤(1)选择音源重要因素:音频的质量(2)录制数字音频A、设置音频硬件配置B、选择采样率和量化位数C、设置音轨的音源和输出端口D、检测输入音频的强度(3)音频的编辑和存储(4)音频的播放(硬件需求)3、产生失真的原因及解决方法原因:(1)信号频带宽,但采样频率不够高,数字音频信号发生混叠;(2)模拟音频信号幅度太大,超过了量化器范围。解决方法:前者:选择与信号相匹配的采样频率后者:可以调整音源的输出幅度或调节采集卡输入放大器的增益,也可选用音频卡的line输入端,而不用microphone输入端。4、利用AudioEditor实现音频制作(1)简介(2)数字音频的录制(3)