第1章多媒体技术基本概念1.1多媒体的定义媒体●所谓媒体(medius)就是指表示和传播信息的载体文字、数据、声音、图形、图像等都属于媒体。媒体分类●感觉媒体(Perceptionmedium)感觉媒体指的是能直接作用于人们的感觉器官,从而能使人产生直接感觉的媒体。如文字、数据、声音、图形、图像等。在多媒体计算机技术中,我们所说的媒体一般指的是感觉媒体。●表示媒体(Representationmedium)表示媒体指的是为了传输感觉媒体而人为研究出来的媒体,借助于此种媒体,能有效地存储感觉媒体或将感觉媒体从一个地方传送到另一个地方。如语言编码、电报码、条形码等。●显示媒体(Presentationmedium)显示媒体指的是用于通信中使电信号和感觉媒体之间产生转换用的媒体。如输入、输出设备,包括键盘、鼠标器、显示器、打印机等。●存储媒体(Storagemedium)存储媒体指的是用于存放表示媒体的媒体。如纸张、磁带、磁盘、光盘等。●传输媒体(Transmissionmedium)传输媒体指的用于传输某种媒体的物理媒体。如双绞线、电缆、光纤等。多媒体“多媒体(Multimedia)”实际是“多媒体技术”的同义词,在这里,“多媒体技术”又是指“多媒体计算机技术(MultimediaComputerTechnology)”。●多媒体计算机技术的定义:计算机综合处理多种媒体信息,使多种信息建立逻辑连接,集成为一个系统并具有交互性。多媒体计算机技术的主要特性●多样性●集成性●交互性1.3多媒体计算机的基本技术和关键技术1.3.1视频和音频数据压缩和解压缩技术多媒体数据压缩及编码技术是多媒体系统的关键技术。数字化的声音和图像数据量非常大,例如,一分钟的声音信号约为:660KB~10MB;一幅800*600的真彩色图像约为1.4MB;一秒钟全活动视频画面约为22MB。在未压缩的情况下,实现动态视频及立体声的实时处理,对目前的微机来说是无法实现的。因此,必须对多媒体信息进行实时压缩和解压缩。数据压缩技术与多媒体技术的发展是相辅相成的。研究结果表明,选用合适的数据压缩技术,有可能将原始文字量数据压缩到原来的1/2左右,语音数据量压缩到原来的1/2~1/10,图像数据量压缩到原来的1/2~1/60。对声音数据的压缩一般采用去掉重复代码和去掉声音数据中的无声音信号序列两种方法。对静止图像压缩广泛采用JPEG算法标准。由于用计算机的中央处理器CPU来完成JPEG算法花费的时间太长,所以都是用专门的JPEG算法信号处理器来完成运算。对视频图像压缩算法有MPEG、DVI、H.261算法。这些算法是由相应的算法信号处理器来1.3.8超文本与超媒体技术超文本(Hypertext)是一种新颖的文本信息管理技术,是一种典型的数据库技术。它是一个非线性的结构,以结点为单位组织信息,在结点与结点之间通过表示它们之间关系的链加以连接,构成表达特定内容的信息网络,用户可以有选择地查阅自己感兴趣的文本。若这种表达信息方式不仅是文本,还包括图像、声音等形式则称为超媒体(Hypermedia)系统。1.5多媒体的发展多媒体技术的发展历程:●1984年美国Apple公司推出被认为是代表多媒体技术兴起的Machintosh系列机。●1985年美国Commodore公司的Amiga计算机问世,成为多媒体技术先驱产品之一。●1986年3月飞利浦和索尼两家公司宣布发明了交互式光盘系统(CD-I),这是集文字、图像和声音于一体的多媒体系统。●1987年3月,美国RCA公司的萨诺夫研究实验室展示了交互式数字影像系统(DVI),这是以PC技术为基础,用标准光盘来存储和检索活动影像、静止图像、声音和其他数据。多媒体个人计算机(MPC)标准:1990年10提出MPC1.0;1993年提出MPC2.0;1995年6月提出MPC3.0。练习题:1、媒体中的()指的是能直接作用于人们的感觉器官,从而能使人产生直接感觉的媒体。A感觉媒体B表示媒体C显示媒体D存储媒体2、多媒体技术的主要特性有:(1)多样性、(2)集成性、(3)交互性、(4)实时性A仅(1)B(1)、(2)C(1)、(2)、(3)D全部3、下列哪种说法不正确?A有格式的数据才能表达信息的含义B不同的媒体所表达信息的程序不同C媒体之间的关系也代表着信息D任何媒体之间都可以直接进行相互转换5、媒体中的()指的是为了传送感觉媒体而人为研究出来的媒体。借助于此种媒体,便能更有效地存储感觉媒体或将感觉媒体从一个地方传送到遥远的另一个地方。A感觉媒体B表示媒体C显示媒体D存储媒体6、请根据多媒体的特性判断以下哪些属于多媒体的范畴?(1)交互式视频游戏、(2)有声图书、(3)彩色画报、(4)彩色电视A仅(1)B(1)、(2)C(1)、(2)、(3)D全部7、下列哪些媒体属于感觉媒体?(1)语音、(2)图像、(3)语音编码、(4)文本A(1)、(2)B(1)、(3)C(1)、(2)、(4)D(2)、(3)、(4)8、目前的研究表明,选用合适的数据压缩技术,可将语音数据量压缩到原来的()。A1/2B1/2~1/10C1/2~1/20D1/2~1/409、下列哪些不是多媒体核心软件?(1)AVSS、(2)AVK、(3)DOS、(4)AmigaVisionA(3)B(4)C(3)、(4)D(1)、(3)10、1985年,美国Commodore公司的()是多媒体技术的先驱产品之一。AMacintoshBCD-ICAmigaDDVI11、1987年展示的()用标准光盘来存储和检索活动影像、静止图像、声音和其他数据。ACD-IBMPCCCD-ROMDDVI12、下列哪些是多媒体技术的发展方向?(1)高分辩率,提高显示质量、(2)高速度化,缩短处理时间、(3)简单化,便于操作、(4)智能化,提高信息识别能力A(1)、(2)、(3)B(1)、(2)、(4)C(1)、(3)、(4)D全部13、下列哪些特征不是多媒体技术的主要特性:(1)实时性、(2)多样性、(3)集成性、(4)交互性A仅(1)B(1)、(2)C(1)、(2)、(3)D全部14、媒体中的()指的是用于通信中使电信号和感觉媒体之间产生转换用的媒体。A感觉媒体B表示媒体C显示媒体D存储媒体15、下列哪些是多媒体计算机的发展趋势?(1)CSCW、(2)文字识别和输入、(3)自然语言理解和机器翻译、(4)机器人视觉和计算机视觉A(1)、(2)、(3)B(1)、(2)、(4)C(1)、(3)、(4)D全部第2章音频、视频信息获取和处理2.1声音卡和音频信息声音是一种波,它有两个基本参数:频率和幅度。凡是通过声音形式传递的信息媒体,都属于听觉媒体,主要包括波形声音、语音和音乐。现在公认的声音质量分为四级:●数字激光唱盘(CD-DA)质量:10Hz~20000Hz●调频无线电广播(FM)质量:20Hz~15000Hz●调幅无线电广播(AM)质量:50Hz~7000Hz●电话质量:200Hz~3400Hz在多媒体计算机中只有经过数字化后的声音才能播放与处理。音频数字化主要涉及到音频信号的采样、量化和编码。声音卡正是完成音频数字化处理的主要多媒体计算机硬件设备。多媒体涉及到以下几个方面的音频处理技术:●音频采集●文语转换●声音编码/解码●语音识别●音乐合成2.1.1声音卡的功能和分类处理音频信号的PC插卡是音频卡(AudioCard),又称声音卡,声音卡处理的音频媒体有数字化声音(WAVE)、合成音乐(MIDI)、CD音频。声音卡通常带有自己的CPU,具有较高的智能性和灵活性。声音卡的分类声音卡的分类主要是根据其采样量化的位数来确定的,通常分为8位、16位和32位声卡。声音卡的主要功能●录制、编辑和回放数字声音文件●控制、混合各声源的音量●在录制和回放数字声音文件时执行压缩/解压缩●采用语音合成技术让电脑朗读英文文本●具有MIDI接口,支持通用MIDI●具备内部FM合成器或波表合成器●具备CD-ROM驱动器接口(IDE或SCSI)●支持至少一种主要的声卡软件标准(Adlib,SoundBlasterPro,MicrosoftSoundSystem,RolandMPU401和MT32等)●支持全双工功能,即能同时录音和放音,该功能主要用于可视电话和会议系统2.1.4声音卡的选择及应用声音卡的基本技术指标●采样频率●量化位数●声道数●内部声音混合调节器●合成器2.1.5音乐合成和MIDIMIDI(MusicalInstrumentDigitalInterface)是指乐器数字接口,是数字音乐的国际标准。任何电子乐器,只要有处理MIDI消息的微处理器,并有合适的硬件接口,都可以成为一个MIDI设备。2.2视频卡和视频信息处理●模拟视频●数字视频●视频数字化:在一段时间内以一定的速度对视频信号进行捕获并加以采样后形成数字化数据的处理过程。影像视频(又称数字视频、数字电影),简称视频,由一幅幅帧序列组成,这些帧以一定的速率播放,使观察者得到连续运动的感觉。模拟视频成本低、还原度好;数字视频长时间保存质量不降低、可以进行创造性编辑。●全屏幕视频●全运动视频视频在处理过程中与电视技术有非常密切的关系。电视主要有三大制式,即NTSC、PAL、SECAM。NTSC是1953年美国研制成功的一种兼容彩电制式,主要在美国、日本、台湾等地区使用,此制式规定:每秒30帧视频画面,水平扫描线为525条,水平分辨率为240~400个像素点,采用隔行扫描方式,场频为60Hz,行频为15634Hz。PAL是1962年在西德诞生,主要在中国及欧洲大多数地区使用,此制式规定:每秒25帧,每帧625行,每行240~400个像素点,隔行扫描方式,场频为50Hz,行频为15625Hz。SECAM是由法国人提出,主要在法国、俄罗斯、非洲地区使用,此制式规定:每秒25帧,每帧625行,每行625个像素点,场频为50Hz,行频为15625Hz。●视频信号的采集:将视频信号经硬件(视频捕捉卡)数字化后,再将数字化数据加以存储。动态视频对于颜色空间的表示有多种情况,最常见的是R,G,B三维彩色空间。也还有其他彩色空间表示,如Y,U,V(Y为亮度,U,V为色差),H,S,I(色调,饱和度,强度)等,并且还可以通过坐标变换而相互变换。2.2.1视频卡的功能和种类视频卡是基于PC机的一种多媒体视频信号处理平台,它可以汇集视频源、声频源和激光视盘机(LaserVideoDiscPlayer)、录像机(VCR)、摄像机(Camera)等的信息,经过编辑或特技处理而产生非常漂亮的画面,这些画面可以被捕捉、数字化、冻结、存储、输出及进行其他的操作。对画面的修正、像素显示调整、缩放功能等都是视频卡支持的标准功能。1、视频卡的分类●视频捕捉卡(VideoCaptureCard)将视频信号连续转换成计算机存储的数字信号保存在计算机中或在VGA显示器上显示。又称为视频采集卡●视频压缩卡(JPEG/MPEGCompressionCard)能够实时完成压缩的视频捕捉卡。价格较高●视频播放卡实现将压缩保存在计算机中的视频信号在计算机的显示器上播放出来。又称为电影回放卡、MPEG解压缩卡●电视卡将标准的NTSC、PAL、SECAM电视信号转换成VGA信号在计算机屏幕上显示。这类卡也称为TV-VGA卡或电视调谐卡(TVTurner),与下面的TV编码器又合称为电视转换卡(VideoConversionCard)。●TV编码器(TVCoder)将计算机的VGA信号转换为NTSC、PAL、SECAM等标准的信号在电视上播放或进行录像,这类卡也称为PC-TV卡、VGA-TV卡等。2、视频卡的主要功能和特征视频卡的主要功能●全活动数字图像的显示、抓取、录制,支持MicrosoftVideoForWindows●可以从VCR、摄像机、ID、IV等视频源中抓取定格,存储输出图像●近似真彩色YUV格式图像缓冲区,并可将缓冲区映射到高端内存●可按比例缩放、剪切、移动、扫描视频图像●色度、饱和度、亮度、对比度