第1章1.1多媒体的基本概念1.1.1多媒体1.1.2多媒体的特性1.2多媒体技术的应用和发展1.2.1多媒体技术的应用1.2.2多媒体技术的发展1.2.3多媒体技术的发展趋势1.3多媒体的研究内容重点:多媒体及多媒体技术的基本概念、多媒体特性难点:多媒体的特性1.1多媒体的基本概念1.1.1多媒体1.数据与信息数据(Data)是客观世界的原始记录符号。这些符号可以是数字、文字、符号、图形、声音等形式。信息(Information)是数据加工后形成的,具有一定意义的数据。单纯的数据本身并无实际意义,只有经过解释后有意义的数据,才能成为信息。从上可知,信息是加工处理后的数据,是有意义的数据。2.媒体与媒介媒体在计算机领域具有两种解释:一是指用以存储信息的物理介质,如磁带、磁盘、光盘和半导体存储器等;二是指传递信息的载体,如数字、文字、声音、图像和图形等。在多媒体技术中,将媒体(Media)定义为信息的载体,媒介(Medium)定义为用于存储、呈现或传输媒体的设备或物理介质。数据、信息与媒介、媒体之间的关系:⑴不同的媒体所表达信息的程度不同。⑵媒体之间的关系是信息。⑶媒体是信息的载体,是信息存在和表现的形式。人对信息的感知、抽象、表现是不同的,这样在存储、传输中所采用的媒体也是不同的。⑷媒体是可以相互转换的。媒体转换就是指媒体从一种形式转换为另一种。通常,媒体转换是要损失信息的,其损失信息对接收者来说是否重要,主要取决于具体的应用及要求。3.多媒体与多媒体技术多媒体是指多种信息载体的表现形式和传递方式,就是用多种媒介方法传输信息。多媒体中的“多”、“媒”、“体”三字含义:“多”指多种媒体的表现,多种感官的作用,多种设备的使用,多学科的交汇,多领域的应用,同时,这个“多”也是随着社会的发展而变化的,如新产生的新媒体研究对象——流媒体、超媒体、控制对象等;“媒”指人与客观世界的中介;“体”指综合、集成的一体化。多媒体技术是指用计算机综合处理多媒体信息,使多种形式的信息建立逻辑连接,集成为一个系统并具有交互性的技术。多媒体不仅是信息的集成,也是设备的集成和软件的集成,并通过逻辑连接形成有机整体,可实现交互控制。集成和交互可以说是多媒体的精髓。1.1.2多媒体的特性⑴集成性:集成性是多媒体的一个重要特性,主要体现在两个方面:一是多媒体信息的集成;二是操作这些媒体信息的工具和设备的集成⑵交互性:多媒体的交互性可以分成初、中、高三个阶段:媒体信息的简单检索与显示,是初级交互应用阶段;通过交互特性使用户介入到信息的活动过程中,是中级交互应用阶段;当用户完全进入到一个与信息环境一体化的虚拟信息空间自由遨游时,是高级交互应用阶段。⑶信息载体多样性:信息载体的多样性是多媒体技术要解决的关键问题之一。⑷协同性:每种单媒体都具有自身规律,只有各种单媒体之间有机配合,才能协调一致,保证多媒体的实施效果和功能。多种媒体之间的协调以及时间、空间的协调也是多媒体技术关键问题之一。1.2多媒体技术的应用和发展1.2.1多媒体技术的应用1.办公、教育领域⑴桌面视频演播系统;⑵桌面出版和演示系统;⑶新型办公自动化系统;⑷教育2.通信与企业生产管理3.商业、旅游4.多媒体数据库1.2.2多媒体技术的发展在多媒体技术的发展历程中,有如下代表性发展阶段:⑴1984年,美国Apple公司推出了Macintosh操作系统。⑵1985年,美国Commodore个人计算机公司率先推出世界上第一台多媒体计算机Amiga。⑶1986年,荷兰Philips公司和日本Sony公司联合研制并推出了交互式紧凑光盘系统CD-I(CompactDiscInteractive)。⑷1987年,美国RCA公司推出了交互式数字视频系统DVI⑸1990年,美国Microsoft公司联合IBM、Intel、DELL等十家生产厂商,发起并成立了“多媒体个人计算机市场协会”(MultimediaPCMaketingCouncil,简称MPC市场协会)。⑹1991年,第六届国际多媒体技术和CD-ROM大会宣布了CD-ROM/XA扩充结构标准的审定版本。⑺1992年,美国Microsoft公司推出了Windows3.1操作系统⑻1993年,MPC市场协会公布了MPCLevel-II标准。⑼1995年,MPC市场协会公布了MPCLevel-III标准。1.2.2多媒体技术的发展趋势⑴进一步完善计算机支持的协同工作环境。⑵增强计算机的智能。⑶把多媒体和通信技术融合到CPU芯片中。⑷多媒体技术促进了网络、通信、娱乐和计算机技术等领域的融合,呈现出以下发展方向:高分辨率。提高显示质量;高速度。缩短处理时间;简单化。便于操作;高维化。有利于展现;智能化。有助于提高信息识别和处理效率;标准化。促进信息交换和资源共享。1.3多媒体技术的研究内容①图形与图像处理技术②音频与视频处理技术③多媒体网络技术④基于多媒体的内容检索技术第3章3.1概述3.1.1声音的基本特征3.1.2声音的三要素3.1.3音频的分类3.1.4常见音频文件格式3.2声音数字化过程3.2.1音频的数字化3.2.2音乐合成3.2.3MIDI3.3音频处理软件3.3.1Goldwave3.3.2AudioEditor3.3.3SoundForge3.3.4CoolEdit3.3.5Cakewalk重点:声音的基本概念、音频处理方法难点:声音的数字化过程3.1.1声音的基本特征声音是振动波,具有振幅、周期和频率。声波的频率(Frequency)描述每秒钟振动的次数,反映出声音的音调:声音尖细表示频率高声音低粗表示频率低。3.1.1声音的基本特征次声主要来自大自然,如地震、火山、台风、海啸、大气湍流等自然现象;超声既可以来自大自然的风声、水浪,又可以来自一些动物的发声器官,还可以来自各种人造超声源;次声波长最小也大于17米,可以走曲线,绕过高山;超声波长最大也不过17毫米;波长很短,可以走直线;3.1.1声音的基本特征次声可以引起人体内脏器官的共振,造成眩晕,甚至内脏出血,使人丧命;超声可以为病人透视、按摩、治疗疾病,使人健康;还可以清洗、除尘,化、粉碎,割焊、钻孔、消毒、杀菌,促进化学反应,影响生物生存。次声1883年我从印尼一个火山口出发,绕地球一直转了三圈多,历经108个小时。超声从超声波发生器发出来,可以穿过5米厚的钢块,只要千分之一秒的时间;3.1.2声音的三要素音调-(高低)音强-(强弱)音色-(特质)也称音高,表示人耳对声音调子高低的主观感受。客观上音高大小主要取决于声波基频的高低,频率高则音调高,反之则低。又称响度或音量,它表示声音能量的强弱程度,主要取决于声波振幅的大小。音强与声波的振幅成正比,振幅越大,强度越大。又称音品,主要由声音波形的谐波频谱和包络决定3.1.2声音的三要素声音波形的基频所产生的听的最清楚的音称为基音,各次谐波的微小振动产生的声音称为泛音。所谓纯音或单音,是指单一频率、或振幅和频率不变的声音信号,单音一般只能由专用电子设备产生;在日常生活中,我们听到的自然界的声音一般都属于复音,其声音信号由不同的振幅与频率合成而得到。音质与频率范围成正比,频率范围越宽音质越好3.1.3音频的分类语音是人类发音器官发出的具有区别意义功能的声音。语音的物理基础主要有音高、音强、音长、音色音效是指有特殊效果的声音,例如,汽车声、鼓掌声、打碎碗、玻璃声音等。音乐是指有旋律的乐曲,一般采用MID文件。3.1.3音频的分类数字化声波。即将麦克风插在计算机的声卡上,利用录音软件,将语音、音乐等波形信息经模/数转换,得到数字化形式进行存储、编辑,需要时再经过数/模转换还原成原来的波形。MIDI合成。利用连接电脑的MIDI(乐器数字化接口),弹奏出曲子,或合成音效录入计算机,再用声音软件编辑。来源于声音素材库。将录音带或CD唱盘等声音素材库中的曲子,用放音设备通过转接线转录到计算机,再用声音软件加以编辑,存成多媒体著作软件可以读取的文件格式。3.1.3音频的分类MIDI(MusicalInstrumentDigitalInterface)乐器接口文件用于合成、游戏,记录音符时值、频率、音色特征,数据量小WAVE(WaveformAudio)波形音频文件多媒体系统、音乐光盘制作,记录物理波形,数据量大CDA(CDAudio)激光音频文件准确记录声波,数据量大,经过采样,生成wav和mp3音频文件mp3(MPEG音频压缩标准)压缩音频文件必须经过解压缩,数据量小3.1.4常见音频文件格式Windows存放数字声音的标准格式,用于记录声音的波形声音效果稳定,一致性好;可真实地记录任何一种声源发出的声音,如乐器、人声、鸟鸣、海涛声等;数据记录详实,音频数据基本上没有经过压缩处理,数据量大。提供了电子乐器与计算机内部之间的连接界面和信息交流方式根据MPEG-1视频压缩标准中,对立体声伴音进行三层压缩的方法所得到的声音文件在运算时剔除了人耳听不到的太高(超过20kHz)或者太低(低于20Hz)频率的声音特性.因为音频信息本身并不是一成不变的,有的部分(如多重声音同时出现和高音等环节)就需要比较多的码率来描述,而有的部分(如空白、独唱和相对比较简单的低频信号等)不需要太多码率来表现,如果采用恒定比特率来对整段音乐进行编码,会造成声音还原不够准确,信息丢失比较多。MP3首先以44.1kHz的采样频率对模拟音频信号进行采样,然后用16位的数值来量化采样点的信号强度,最后利用可变比特率(VBR,VariableBitRate)的编码方式来对整段音乐进行编码。3.2.1音频的数字化把声音(模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列每隔一定时间间隔不停地间断性地在模拟音频的波形上采取一个幅度值,这一过程我们称之为采样;为了把采样得到的离散序列信号存入计算机,必须将其转换为二进制数字表示,我们称这一过程为量化编码。采样频率是指计算机每秒钟对声波幅度值样本采样的次数,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准,计量单位为Hz(赫兹);采样通常采用三种频率:11.025KHz、22.05KHz、44.1KHz。采样得到的样本需要量化,所谓的量化位数也称“量化精度”,是描述每个采样点样本值的二进制位数。常用的量化位数为8位、12位、16位。量化级大小决定了声音的动态范围,即被记录和重放的声音最高与最低之间的差值。量化位数越高音质越好,数据量也越大。声音通道的个数称为声道数,是指一次采样所记录产生的声音波形个数。记录声音时,如果每次生成一个声波数据,称为单声道;每次生成两个声波数据,称为双声道(立体声)。随着声道数的增加,音频文件所占用的存储容量也成倍增加,同时声音质量也会提高。未经压缩的WAV音频文件容量计算公式:存储容量(字节)=采样频率×量化位数/8×声道数×时间【例3.1】一段持续1分钟的双声道声音文件,若采样频率为22.05kHz,量化精度为8位,数字化后需要的存贮容量为多少?22.05×103×8/8×2×60=2.646MB3.2.2音乐合成使用电子元器件(或计算机)生成音乐的技术称为电子音乐合成拟式电子合成器是通过对震荡器的控制来实现音乐合成的,主要有减法合成和加法合成两种。数字式合成器不是由电子元器件制成的信号发生器来产生声音中的各种频率成分,而是直接通过数字的方法来造出波形,然后转换为声音信息。其实数字式合成器就是一台特殊的计算机,也是软硬件的综合体。数字合成法主要有FM(FrequencyModulation)频率调制合成和音乐样本合成两种。用数字信号来表示不同乐音的波形,然后把它们组合起来,再通过数模转换器(DAC)生成乐音播放。特点:结构简单,成本低,模仿能力很差用FM合成法产生各种逼真的乐音很困难,有些乐音几乎不能产生,目前只有低档次的声卡采用FM合成法。中高档的声音卡一般采用乐音样本合成法,即波表(WaveTable)合成法。波表合成采用一种称之为“波表查找”技术来产