大学计算机基础电气与信息工程学院计算机系主讲教师:柏顺全2020年11月第5章多媒体技术基础5.1多媒体技术的基本概念5.2多媒体信息的数字化和压缩技术5.3多媒体常用软件本章重点内容多媒体技术的基本概念数据压缩技术的基本知识5.1多媒体技术的基本概念5.5.1多媒体及多媒体技术5.5.2多媒体技术的特征5.1.3多媒体信息处理的关键技术5.1.4多媒体技术的应用领域5.1.1多媒体及多媒体技术媒体是信息的载体比如声音、图像、动画、文字等媒体是信息的存储实体比如磁带、磁盘、光盘等。媒体的两个涵义5.1.1多媒体及多媒体技术国际电信联盟电信标准部(ITU-TSS)制定了多媒体的ITU-TI.374标准,在标准中把媒体分为5类。感觉媒体使人产生直观感觉的各种媒体。如声音、颜色等。显示媒体指感觉媒体与电磁信号之间的转换媒体。显示媒体分为输入显示媒体和输出显示媒体。如:光笔、显示器、音响等。多媒体的类型5.1.1多媒体及多媒体技术表示媒体对感觉媒体的抽象描述形成表示媒体。比如声音编码、图像编码等。存储媒体指存储表示媒体的物理设备,比如磁带、磁盘、光盘等。传输媒体指传输表示媒体的物理介质,比如光缆、电缆、电磁波、微波等多媒体的类型“多媒体”一词源自Multimedia5.1.1多媒体及多媒体技术什么是多媒体?Multiple多重、复合medium的复数形式media介质、媒介和媒体●多媒体定义多媒体技术是利用计算机对文字、图像、图形、动画、音频、视频等多种信息进行综合处理、建立逻辑关系和人机交互作用的产物。多媒体技术是指利用计算机对多种媒体进行表示、存储和传输的技术,其中多媒体的表示就是对多媒体的处理和加工过程。多媒体技术主要包括以下三个方面:多媒体信息处理技术多媒体存储技术多媒体通信技术。5.1.1多媒体及多媒体技术什么是多媒体技术?5.1.2多媒体技术的特征交互性——是指用户可以与计算机的多种信息媒体进行交互操作,从而为用户提供更加有效地控制和使用信息的手段。交互性是多媒体技术的特色之一,是关键特征。复合性(多样性)——是指计算机所能处理的信息媒体的种类或范围扩大,不仅仅局限于原来的数据、文本或单一的语音、图像。多媒体技术的4个基本特征5.1.3多媒体技术的特征集成性——是指综合处理多种信息媒体。多媒体的集成性包括两方面,一是媒体的集成;另一是处理这些媒体的设备和系统的集成。实时性——当用户给出操作命令时,相应的多媒体信息都能够得到实时控制。多媒体技术的4个基本特征5.1.3多媒体信息处理的关键技术数据压缩技术大容量光盘存储技术多媒体网络技术多媒体专用芯片技术多媒体数据库技术主要包括五个关键技术5.1.3多媒体信息处理的关键技术数据压缩技术多媒体信息的最大特点之一就是采样数据量巨大,为了保证多媒体信息的有效处理、存储及传输等,所以数据压缩技术也就成了多媒体技术中的关键技术。数据压缩技术包括压缩与解压缩。5.1.3多媒体信息处理的关键技术大容量光盘存储技术由于光存储技术是随着多媒体技术的发展而发展的,所以多媒体信息的存储技术一般特指光存储技术。光盘与大容量的磁盘相比,具有容量大、价格低、使用方便等特点。所以怎样用大容量光盘存储图片、音频、动画、视频等多媒体信息,也是关键技术之一。5.1.3多媒体信息处理的关键技术多媒体网络技术多媒体专用芯片技术为了解决音频和视频数据快速压缩与解压及播放等问题,必须使用具有高速计算机能力的专用芯片技术。包括文件传输,电子邮件,远程登录,网络新闻和电子商务等以文本为主的数据通信技术及以声音和电视图象为主的通信技术。5.1.3多媒体信息处理的关键技术多媒体数据库技术由于传统的关系数据库模型及管理方式已不能适用于多媒体信息的管理,所以新的多媒体数据库技术成为了关键技术之一。5.1.4多媒体技术的应用领域教育领域例如:CAI(计算机辅助教学)、CAL(计算机辅助学习)、CMI(计算机管理教学)等.商业与咨询例如:商业广告(特技合成、大型演示)、信息咨询服务(用户可方便地使用触模屏查询需要的相关信息。)主要应用领域有以下几个方面多媒体电子出版物利用CD-ROM大容量的存储空间与多媒体声像功能的结合实现了出版百科全书等电子出版物。广播电视、通信领域例如:多媒体会议系统、多媒体交互电视系统、多媒体电话等虚拟现实通过综合应用计算机图像处理、模拟与仿真、传感技术,以及显示系统等技术和设备,以模拟仿真的方式给用户提供一个真实反映操作对象变化与相互作用的三维图像环境,从而构成虚拟世界。5.1.4多媒体技术的应用领域主要应用领域有以下几个方面5.2多媒体信息的数字化和压缩技术5.2.1数字音频及处理5.2.2数字图像及处理5.2.3数字视频及处理5.2.4数据压缩技术5.2.1数字音频及处理声音的基本概念声音是一条随时间变化的连续曲线,可以用声波来表示。它一般由多种振动频率的声波组成声波有两个基本属性:频率和振幅声音的三要素:音调、音强、音色音频数字化(是计算机处理声音的第一步):将连续的音频模拟信号转换成离散的数字信号.5.2.1数字音频及处理音频信号数字化过程主要包括采样、量化和编码三个过程。数字音频的技术指标5.2.1数字音频及处理采样频率——采样频率是指每秒钟的音频采样次数,单位是Hz(赫兹)。采样频率越高,数字化后的音频越接近原始声,但需要的存储空间也就越大。常见的采样频率11.025kHz,语音信号22.050kHz,要求不太严格的背景音乐44.100kHz,高保真音乐数字音频的技术指标5.2.1数字音频及处理量化位数(采样精度)通常把采样数值所使用的二进制位数称为量化位数。量化位数越高,声波的还原就越细腻,需要的存储空间也越多。目前,主流声卡的量化位数是24位。声道数(有两种)单声道(Mono)信号一次产生一组声波数据。立体声(Stereo)信号一次产生两组声波数据。数字音频文件常见格式5.2.1数字音频及处理WAV文件(.wav):又称为波形文件,是Windows使用的标准数字音频文件,数据量大,通常要压缩。MIDI文件(.mid):又称为音乐格式文件,是乐器数字化接口,用于电声乐器之间的接口,数据量较小。数字音频文件常见格式5.2.1数字音频及处理MPEGLayer3文件(.mp3):是经过压缩的音频文件。WindowsMediaAudio文件(.wma):是另一种格式的音频文件,音质和压缩率都甚过.mp3。数字音频文件常见格式5.2.1数字音频及处理CDAudio文件(.cda):唱片采用的格式。RealAudio文件(.ra.rm.rmx):是一种流媒体音频格式文件,主要适用于网络的音乐在线播放。流媒体的关键技术是数据的流式传输,流媒体文件可以边下载,边播放。而静态多媒体文件需要先下载,后观看。5.2.2数字图像及处理色彩三要素色相(色调):是指色彩的种类。饱和度(纯度):是指色彩的纯净程度,即掺入白光的程度。亮度(明度):是指光所产生的明暗感觉。如:白色最亮,黑色最暗,灰色则居中。图形图像中常用的基本概念5.2.2数字图像及处理位图:也称点阵图,按图像点阵形式存储各像素的颜色编码或灰度级。适用于表现含有大量细节的画面。位图特点:图像逼真、可直接输出,但位图的分辨率是固定的,图像放大时会失真变形、且文件较大,一般需要压缩。在Photoshop中处理的图像都属于位图。图形分为位图和矢量图两种图形图像中常用的基本概念5.2.2数字图像及处理矢量图:用一组指令集或参数来描述其中的各个成分,易于对各个成分进行移动、缩放、旋转和扭曲等变换。矢量图特点:占用的存储空间较小,打印输出和放大时图形质量较高(不失真)。但显示图形时计算时间较长,将矢量图形输入到计算机中很困难。图形图像中常用的基本概念矢量图形(左、中)和点阵图形(右)图示5.2.2数字图像及处理5.2.2数字图像及处理矢量图形放大后不失真点阵图像放大后失真5.2.2数字图像及处理分辨率的分类——输入分辨率、屏幕分辨率、图像分辨率、输出分辨率四种。图像的分辨率(Resolution)——指每一英寸所包含的像素值,分辨率越高,图像越清晰。图形图像中常用的基本概念像素(Pixel)——通常被视为图像的最小的完整采样。5.2.2数字图像及处理RGB模式(RGB(x,y,z)函数):由X(Red)、Y(Green)、Z(B1ue)三种基本颜色光按不同比例相配而成,取值范围:0~255。加色法CMYK模式—印刷时用的四种色彩。C代表青色,M代表洋红色,Y代表黄色,K代表黑色。减色法常见的色彩模式图形图像中常用的基本概念5.2.2数字图像及处理HSB模式:是使用H(色相)、S(饱和度)和B(亮度)三个参数来生成颜色。Lab模式:是国际照明委员会(CIE)于1976年公布的一种色彩模式。所定义的色彩最多,弥补了RGB和CMYK色彩模式的不足。常见的色彩模式图形图像中常用的基本概念5.2.2数字图像及处理位图模式:也称为黑白模式。黑白图像中每个像素点用1位二进制数表示,也称二值图。灰度模式:灰度图像中,每个像素点的亮度值用8位二进制数表示,亮度范围有0~255个灰度等级。常见的色彩模式图形图像中常用的基本概念5.2.2数字图像及处理图形图像中常用的基本概念5.2.2数字图像及处理数字图像的获取方式数字图像可由数码照相机、数码摄像机、扫描仪、手写笔等多媒体设备获取。数字图像可以直接在计算机中进行自动生成或人工设计,或由网络、光盘等设备输入。图像的数字化5.2.2数字图像及处理PSD格式(.psd):Photoshop软件生成的文件格式,是唯一能支持全部图像色彩模式的格式JPEG格式(.jpg.jpeg):是一种压缩格式文件。文件尺寸较小,下载速度快,多用于网络和光盘读物。常见的图像文件格式5.2.2数字图像及处理BMP格式(.bmp):是Windows中的标准图像文件格式,没有压缩,占空间大。GIF格式(.gif):压缩比高,磁盘空间占用较少。PNG格式(.png):一种新兴的网络图像格式,是目前最不失真的图像压缩格式。常见的图像文件格式5.2.3数字视频及处理模拟视频信号视频信号分模拟视频信号和数字视频信号两种。模拟视频信号——就是常见的电视信号,采用模拟方式对图像进行还原处理,这种图像被称为视频模拟图像。5.2.3数字视频及处理NTSC(美国国家电视标准委员会)制式:(美国、日本等采用)PAL(隔行倒相)制式(中国、英国等采用)SECAM制式:(法国、俄罗斯等采用)各种制式的特点各有不同,如:帧频(场频)的不同、分解率的不同、信号带宽以及载频的不同、色彩空间的转换关系的不同等。模拟视频标准目前有三种5.2.3数字视频及处理视频信号数字化模拟电视信号的数字化——就是将模拟信号表示的视频信息用数字表示,从而能够在计算机中对其进行操作。主要包括色彩空间转换;光栅扫描的转换以及分辨率的统一等工作。5.2.3数字视频及处理常用视频文件格式视频格式分为影像格式(videoformat)和流格式(streamvideoformat)。AVI格式是常见的影像格式,而RM、MOV、ASF和WMV是常见的流格式。5.2.4数据压缩技术数据压缩的种类分为两大类无损压缩(冗余压缩):压缩比较低,一般在2:1~5:l之间。如:Huffman(哈夫曼编码)是一种无损压缩。有损压缩(熵压缩法):是不可逆压缩,压缩比高。在还原时,与原始图像存在一定的误差,但效果一般可以接受。压缩比可以从几倍到上百倍。PCM(脉冲编码调制)是一种有损压缩。数据压缩的主要技术指标压缩比:压缩/解压缩速度数据恢复(还原)效果通用性所有同类型的文件应采用一个通用的压缩方法。同一个压缩软件应当能提供多种压缩比和压缩质量的选择,以适应不同场合的需要。5.2.4数据压缩技术第一部分是无损压缩,第二部分是有损压缩JPEG压缩率达到20~40倍5.2.4数据压缩技术静态