第1章多媒体技术概述多媒体技术基础及应用(第2版)刘立新、刘真编著第1章本章主要内容1.1.1基本概念1.多媒体技术(Multimedia)多媒体技术就是计算机综合处理多种媒体信息,如文本、图形、图像、动画、声音和视频等,使多种媒体建立连接,集成为一个具有交互性系统的技术。2.计算机辅助教学(CAI)CAI全称计算机辅助教学(ComputerAssistedInstruction),是指利用计算机帮助教师进行教学或指计算机在教育领域的广泛应用,包括在教学、研究和管理中以各种方式使用计算机。3.多媒体CAI课件多媒体CAI课件是一种教学系统,它的主要功能是教学功能,所以包括课件中的教学内容及其呈现,教学过程及其控制应有教学目标。1.1.2常见媒体元素1.1.2常见媒体元素文本分为非格式化文本文件和格式化文本文件。非格式化文本文件:只有文本信息没有其他任何有关格式信息的文件,又称为纯文本文件或ASCII码文件。如“.TXT”文件。格式化文本文件:带有各种文本排版信息等格式信息的文本文件。如“.DOC”文件。反映字符的有字体(Font)、字形(Style)、字号(Size)以及位置(Align)。1.1.2常见媒体元素图形(Graphic)一般指用计算机绘制软件制作的画面,如直线、圆、圆弧、矩形、任意曲线和图表等。图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。用相应的软件生成的图形文件,图形的记录格式从其扩展名中就能判断出来。如:CAD的扩展名为:dwg;3dMAX的扩展名为:3ds;桌面出版软件扩展名为:wmf;Falsh动画软件扩展名为:fls;illustrator扩展名为:AI。1.1.2常见媒体元素图像(Image)是指由影像输入设备捕捉的实际场景画面,或以数字化形式存储的任意画面,更接近于实际。静止的图像是一个矩阵,阵列中的数字用来描述构成图像的各个点(称为像素点pixel)的强度与颜色等信息。这类图像文件一般由像素点组成。如有位图文件(bmp),数码像机的JPG(JPEG),图像编辑软件生成:psd、PCX、Gif、Tiff等各种流行的图像格式。一般数据量都较大。1.1.2常见媒体元素图像处理时要考虑三个因素:屏幕分辨率:显示器屏幕上的水平与垂直方向的像素个数。图像分辨率:数字化图像的大小,即该图像的水平与垂直方向的像素个数。图像深度(也称图像灰度、颜色深度)数字位图图像中每个像素上用于表示颜色的二进制数字位数。显示深度:表示显示器上每个点用于显示颜色的二进制数字位数。若显示器的显示深度小于数字图像的深度,就会使数字图像颜色的显示失真。1.1.2常见媒体元素1.1.2常见媒体元素数字音频(Audio)可分为波形声音、语音和音乐。波形声音实际上已经包含了所有的声音形式,它可以将任何声音都进行采样量化,相应的文件格式是WAV文件或VOC文件。语音也是一种波形,所以和波形声音的文件格式相同。音乐是符号化了的声音,乐谱可转变为符号媒体形式。对应的文件格式是MID或CMF文件。1.1.2常见媒体元素计算机音频技术根据人的听觉器官的特点,对音频信号加工后,包括声音的采集、数字化、压缩/解压缩以及声音的播放。影响数字声音波形的质量主要因素有:采样频率、量化位数和声道数。采样频率(samplingrate)是将模拟声音波形转换为数字时,每秒钟所抽取声波幅度样本的次数,单位是Hz(赫兹)、KHz。量化位数(也称量化级)是每个采样点能够表示的数据范围,经常采用的有8位、16位。例如,8位量化级表示每个采样点表示28=256个不同量化值,而16位量化级则表示216=65536个不同的量化值。1.1.2常见媒体元素声道数为记录声音时,如果每次生成一个声道数据,称为单声道;每次生成两个声波数据,称为立体声(双声道)。目前高档音响可制作出48声道、64声道高保真节目。数字音频的存储量:可用以下公式估算声音数字化后每秒所需的存储量(未经压缩的)。存储量=采样频率×量化位数÷8使用双声道,存储量再增加一倍。动画是活动的画面,实质是一幅幅静态图像的连续播放。动画的连续播放是指时间和图像内容上上的连续播放。计算机设计动画有两种:一种是帧动画,一种是造型动画。帧动画是由一幅幅位图组成的连续的画面,就如电影胶片或电视视频画面一样要分别设计每屏显示的画面。造型动画是对每一个运动的物体分别进行设计,赋予每个动元一些特征,然后用这些动元构成完整的帧画面。动元的表演和行为是由制作表组成的脚本来控制。存储动画的文件格式有FLC、MOV等。1.1.2常见媒体元素视频是由一幅幅单独的画面序列(帧frame)组成,这些画面以一定的速率(fps)连续地投射在屏幕上,使观察者具有图像连续运动的感觉。视频文件的存储格式有AVI、MPG、MOV等。全世界三大模拟电视技术标准主要有NTSC制、PAL制和SECAM制以及两种高清数字电视DVB、HDTV。NTSC制标准由美国1953年制定。为30fps,每帧525行,隔行扫描,宽高比4:3,扫描频率60Hz。北美、日本采用。PAL制标准由西德1962年制定,为25fps,每帧625行。隔行扫描,宽高比4:3,扫描频率60Hz。中国和西欧大部份采用。SECAM制标准由法国1965年制定。与PAL制不同是对彩色信号的处理方式不同。法国和非洲采用。数字电视技术标准有DVB、HDTV,视频传输信号可达1920×1080i,宽高16:9,每帧扫描1000帧以上。音频上欧洲和日本音频采用MPG2,美国采用AC-3。大量使用数字压缩技术编码和解码。1.1.2常见媒体元素1.1.3媒体类型1.2多媒体技术的关键技术1.2多媒体的关键技术图像、动画、视频和音频等数字化后数据量是非常大的。一幅640X480分辨率的真彩色图像,数据量约为7.37Mbit/帧;视频(运动图像),要以每秒30帧的速度播放,则视频信号的传输速度为221.2Mbit/s,那么一张650MB的CD-ROM光盘,只能播出约23秒钟节目。数字化处理的关键技术问题-数据压缩选用合适的数据压缩技术,有可能将字符数据量压缩到原来的1/2左右,语音数据量压缩到原来的1/2-1/10,图像数据量压缩到原来的1/2-1/60。如今已有压缩编码/解压缩编码的国际标准JPEG(静态图片)和MPEG-II、III(视频压缩技术)。1.2.1多媒体数据压缩技术1.2.2多媒体网络通信技术多媒体网络通信技术是多媒体计算机技术、通信技术(有线和无线网络)结合的产物,它将计算机的交互性、通信的分布性和广播电视的真实性融为一体。多媒体系统通过通信网络传送文本、图形、图像、动画、音频和视频等信息。不同的媒体元素对通信网络要求不同,如:语音和视频有较强的实时性要求,多媒体通信的发展要求有适合于传输多媒体信息的通信网。系统是在因特网上的全球性分布式信息系统,它使用超文本和超媒体技术管理多媒体信息。1.2.3多媒体存储技术多媒体存储技术主要是指发展最快光存储技术。利用数据压缩技术,在一张CD-ROM光盘650MB上能够存取74分钟全运动的视频图像或者十几个小时的语言信息或数千幅静止图像。一张CD-RDVD4.7GB光盘。SONY公司的Blu-ray蓝光HDDVD光盘单面单层25GB,双面双层50GB。与此同时,华纳、东芝公司放弃了HDDVD格式技术。全世界统一技术采用SONY公司的蓝光HDDVD技术标准。大多数具有多媒体处理能力的计算机采用专用的音频和视频数字处理芯片(DSP)。DSP一种是固定功能的芯片;另一种是可编程的数字信号处理器(DSP)芯片。产品有了一定的标准化。1.2.5多媒体输入与输出技术多媒体输入/输出技术:媒体变换技术:是指改变媒体的表现形式。如视频卡、音频卡(声卡)都属媒体变换设备。媒体识别技术:是对信息进行一对一的映像过程。例如,语音识别技术和触摸屏技术等。媒体理解技术:是对信息进行更进一步的分析处理和理解信息内容。如自然语言理解、图像理解、模式识别等技术。媒体综合技术:是把低维信息表示映像成高维的模式空间的过程。例如,语音合成器就可以把语音的内部表示综合为声音输出。1.2.6多媒体系统软件技术超文本语言(HyperTextMakerLanguage)是一种新颖的文本信息管理技术,它提供的方法是建立各种媒体信息之间的网状链接结构,这种结构由节点组成。对超文本进行管理使用的系统称为超文本系统。也即浏览器,或称为导航图。若超文本中的节点的数据不仅可以是文本,还可以是图像、动画、音频、视频,则称为超媒体。1.3.1多媒体个人计算机MPC系统简介多媒体计算机是指能够综合处理多种媒体信息的计算机。MPC=PC+CD-ROM+声卡+显示卡+多媒体操作系统(最好用独立的声卡和显卡)MPC配置特点:(1)一个功能强大,速度快的CPU;(2)大容量的存储器空间;(3)高分辨率显示接口与设备;(4)可处理音响的接口与设备;(5)可处理图像的接口与设备;(6)可存放大量数据的配置等。1.3.1多媒体个人计算机MPC系统简介独立的声卡独立的显卡多媒体应用软件第八层软件系统多媒体创作软件第七层多媒体数据处理软件第六层多媒体操作系统第五层多媒体驱动软件第四层多媒体输入/输出控制卡及接口第三层硬件系统多媒体计算机硬件第二层多媒体外围设备第一层多媒体计算机系统组成结构1.3.2多媒体计算机系统硬件组成结构1.3.2多媒体计算机系统硬件组成结构声卡由声源获取声音,并进行模拟/数字转换或压缩,而后存入计算机中进行处理。声卡还可以把经过计算机处理的数字化声音通过解压缩、数字/模拟转换后,送到输出设备进行播放或录制。视频卡采集来自输入设备的视频信号,并完成由模拟量到数字量的转换、压缩,以数字化形式存入计算机中,数字视频可在计算机中进行播放。1.3.2多媒体计算机系统硬件组成结构多媒体软件系统包括:⑴多媒体系统软件:多媒体驱动软件和多媒体操作系统;⑵多媒体支持软件(开发工具):多媒体数据处理软件和多媒体创作软件;⑶多媒体应用系统1.3.2在多媒体计算机系统中应用的软件多媒体素材制作软件文本编辑图形与图像处理音频编辑视频编缉动画编辑多媒体著作工具AuthorwareDirector多媒体软件编程技术1.3.2在多媒体计算机系统中应用的软件1.3.3MPC对系统工作环境的要求和发展趋势硬件系统的要求:•在配置MPC时应该具备大容量的硬盘;•具有快速数据处理和传输能力的CPU和PCI总线;•建立更大的高速缓存区以提高微机的运行速度,内存一般在1GB以上;•高分辨率的图形、图像显示。图形显示卡要有高的分辨率和存储容量;•高质量的声卡和音响设备。为了声音的采集和回放具有较好的音质,应该采用具有44.1kHz采样频率和16位或32位采样位数的声卡。软件系统的要求:(1)多媒体操作系统实时任务调度、多媒体数据转换和同步控制机制多媒体设备的驱动和控制图形和声像功能的用户接口。(2)多媒体数据库及其管理系统多媒体数据的特点面向对象数据库的研究多媒体数据库的数据模型多媒体数据库检索与查询1.3.3MPC对系统工作环境的要求和发展趋势1.3.4多媒体计算机常用存储设备1.激光存储器光盘存储技术包括存储容量、数据传输率(倍速)、平均存取时间、接口标准等。按照光盘系统的读写能力,分为三类:只读型、一次写入型、可重写型。①只读型(CD-ROM)CD-ROM光盘的内容是在制作光盘时写入的,用户可CD-ROM读取信息,而不能往盘上写信息②一次写光盘系统(CD-WROM)一次写多次读光盘系统中的光盘,只读光盘。③可重写型(Rewriteable或Erasable)可重写型光盘像磁盘一样具有可擦写性。2.活动存储器大容量活动存储设备按性能分为3类:移动硬盘、可写光盘及闪盘类。1.3.4多媒体计算机常用存储设备3.新型存储模式NAS(NetworkAttachedStorage)称为网络附加存储,被定义为特殊的专用数