多媒体和 flash

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数字音频的编辑和处理声音信号的两个基本参数是频率和幅度。频率是指信号每秒钟变化的次数,用Hz表示。人们把频率小于20Hz的信号称为亚音信号,或称为次音信号(subsonic);频率范围为20Hz~20kHz的信号称为音频(audio)信号;虽然人的发音器官发出的声音频率大约是80Hz~3400Hz,但人说话的信号频率通常为300Hz~3000Hz,人们把在这种频率范围的信号称为话音(speech)信号;高于20kHz的信号称为超音频信号,或称超声波(ultrasonic)信号。在多媒体技术中,处理的信号主要是音频信号,它包括音乐、话音、风声、雨声、鸟叫声、机器声等。1.声音的数字化声音进入计算机的第一步就是数字化。人耳听到的声音是一种具有振幅、周期的声波,计算机要处理这种声波,可以通过话筒把机械振动转变成相应的电信号,这也是一种连续的模拟信号,而计算机只能处理数字量,所以只有把这种模拟量转换成数字量计算机才能处理。这个转换过程称为模/数转换(A/D转换)即声音的数字化。模/数转换过程主要分采样、量化及编码3步。(1)采样。在某个特定的时刻对模拟信号进行测量叫做采样(sampling)。其做法是每隔一定时间对模拟信号的幅值进行测量,得到离散的幅值,用它代表两次采样之间的模拟值。假设输入电压的范围是-4V~4V,并假设它的取值只限定在0、1、2、…,7共8个值。第一次采样得到的幅度值是-0.82V,它的取值就应算作-1V,第二次采样得到的幅度值是0.89V,它的取值就算作1V,以此类推下去即可得到一系列的采样值,用这些离散数值代表相应时间段内声音的连续值(如图10-1所示)。图10-1声音的采样和量化采样频率是指单位时间(1s)内采样的次数。采样频率越高,声音回放出来的效果越好,文件所占的存储空间也就越大。采样频率不应低于声音信号最高频率的两倍,常用的采样频率有44.1kHz、22.05kHz、10.25kHz。(2)量化。量化是将经过采样得到的离散数据转换成二进制数的过程,量化位数即分辨率是指将经过采样得到的离散数据转换成几位二进制数。上例中,如果取量化位数为8位,即将采样的到的值用8位二进制数表示,则第一次采样得到的值-1即可表示为-00000001,第二次采样得到的值可表示为00000001。在多媒体计算机中音频的量化位数一般为32、16、8、4位。显然,量化位数(二进制位数)越多,量化后的波形越接近原始波形,声音的音质越好,存储该声音所用的文件也就越大。(3)编码。将采样量化后的二进制数据按照一定的规则进行组织,以利于计算机的处理称为编码。最简单的编码是用二进制的补码表示。如上例中第一次采样值-1经过编码后被表示为11111111,第二次表示为00000001。上述声音的数字化过程是由声卡完成的。一秒钟声卡对声音采样上千次,通过模/数转换器将模拟声波转换成数字信息存储在扩展名为.wav的波形文件中。当声音播放时,声卡中的数/模转换器将声音还原成模拟信号、放大输出到喇叭或耳机,变成人耳能够听到的声音。2.声音的压缩(1)声音文件的大小。一般来说,采样频率、量化位数越高,声音质量也就越高,保存这段声音所用的空间也就越大。立体声(用两个波形记录声音)是单声道(用一个波形记录声音)文件的2倍。即文件大小(B)=采样频率(Hz)×录音时间(s)×(分辨率/8)×通道数(单声道为1,立体声为2)如:采用采样频率为44.1kHz,分辨率为16位,立体声的标准录音,录制10s的文件大小为:44.1×103×10×(16/8)×2=1764000B即1.68MB由此可见,音频的数字化要占用很大的空间,因此对音频数字化信号进行压缩是十分必要的。(2)声音的压缩。声音信号的压缩编码方式有两种:一种是波形编码技术,针对声音波形进行编码;另一种是声码技术,是对声音数字信号进行分析,提取其特征参数。经编码后可由重构来合成声音信号。波形编码是对声音波形进行抽样、量化、编码。在信号采样和量化过程中,考虑到人的听觉特性,使编码后的音频信号与原始信号的波形尽可能匹配,采样频率如果在9.6Kbps~64Kbps的到的声音信号的质量较高。但波形编码法易受量化噪声影响,进一步降低编码率也较困难。常用的压缩编码是DPCM(差分脉冲编码调制)和ADPCM(自适应差分量化)。参数分析与合成的编码方法是以声音信号产生的模型为基础,将声音信号转换成参数后再进一步编码。声音的基本参数是基音周期、共振峰、语音谱、声强等。利用这些参数,就可以不对声音的波形进行编码,只要记录和传输这些参数就能实现声音数据的压缩。声音的基本参数可以由声音生成机构模型通过实验得到。典型的分析合成技术有通道声码器、同态声码器和线性预测声码器。其压缩率大,但计算量大、保真度不高,适合于语音信号的编码。典型的有LPC线性预测编码。3.声音文件的格式声音数据有多种存储格式,目前比较流行的有以.wav(waveform)、.au(audio)、.aiff(audiointerchangeablefileformat)和.snd(sound)等为扩展名的文件格式。.wav格式主要用在PC上,.au主要用在Unix工作站上,.aiff和snd主要用在苹果机和美国视算科技有限公司(SiliconGraphicsInc.,SGI)的工作站上。这里主要介绍.wav和.midi。(1)WAV文件。WAV文件是微软公司的音频文件格式,又称为波形文件格式,它来源于对声音模拟波形的采样,用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数把这些采样点的值转换成二进制数,然后存盘,就产生了声音的WAV文件。此种格式的声音是由采样数据组成的,所以它需要的存储容量很大。用前面介绍的公式可以简单地推算出WAV文件的文件大小。(2)MIDI文件。MIDI是MusicalInstrumentDigitalInterface的首写字母组合词,可译成“电子乐器数字接口”,是用于在音乐合成器(musicsynthesizers)、乐器(musicalinstruments)和计算机之间交换音乐信息的一种标准协议。MIDI是乐器和计算机使用的标准语言,是一套指令(即命令的约定),它指示乐器即MIDI设备要做什么、怎么做,如演奏音符、加大音量、生成音响效果等。MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其他装置让它产生声音或执行某个动作的指令。当信息通过音乐或声音合成器进行播放时,该合成器对系列的MIDI信息进行解释,然后产生出相应的音乐或声音。记录MIDI信息的标准格式文件称为MIDI文件,其中包含音符、定时和多达16个通道的乐器定义及键号、通道号、持续时间、音量和击键力度等各个音符的有关信息。由于MIDI文件是一系列指令而不是波形数据的集合,所以其要求的存储空间较小。(3)WAV文件和MIDI文件的区别。WAV文件记录的是声音的波形,要求较大的存储空间;MIDI文件记录的是一系列的指令,文件紧凑占用空间小,预先装载比WAV容易,设计播放所需音频的灵活性较大。WAV文件的可编辑性好于MIDI文件,音质也比MIDI文件饱满。由此可见,WAV文件适合于:①计算机资源足够处理数字文件。②有语言会话的需要。③对回放设备没有特定要求。MIDI文件适合于:①没有足够的内存、硬盘空间或CPU处理能力不强。②具备符合要求的回放设备。③具有高质量的声源。④没有语言对话的需要。(4)VOC文件。VOC文件是Creative公司波形音频文件格式,也是声霸卡使用的音频格式文件。每个VOC文件由文件头块和数据块组成。声霸卡提供的软件可以实现VOC和WAV文件的转换。10.2.2多媒体图像技术在计算机屏幕上显示的文本和画面通常用位图图像、矢量图形来描述。1.位图图像(1)概念。位图图像是通过显示器像素点的颜色和亮度来反映原始图像的效果。可以把一幅位图图像理解为一个矩阵,矩阵中的每个元素就是图像中的一点,称之为像素。每个像素都有颜色和亮度。矩阵中的所有不同颜色、不同亮度的点就组成了一幅图像。位图图像适合于表现比较细致,层次、颜色比较丰富,含有大量细节的图像。(2)位图图像的相关概念。①分辨率分辨率包括屏幕分辨率、图像分辨率和像素分辨率3种。屏幕分辨率指计算机屏幕上最大显示区域水平和垂直方向上的像素个数,如VGA显示器的屏幕分辨率为640×480,是指水平方向有640个像素,垂直方向上有480个像素。图像分辨率是指图像数字化时,在水平、垂直方向上的像素个数。当图像分辨率大于屏幕分辨率时屏幕上只能显示一部分图像。像素分辨率是指一个像素点的长和宽的比例。像素点尽可能长宽相等,使之成为正方形,否则图像就会变形。②色彩空间色彩空间是指彩色图像所使用的颜色描述方法(也叫彩色模式),如RGB空间就是通过调节R(红)、G(绿)、B(蓝)3种颜色的组成成分使人眼和大脑感受各种各样的颜色。常用的颜色空间有RGB、CMYK(青、品红、黄、黑)、HSB(色相、饱和度、亮度)等。③图像深度图像深度是指图像中可能出现的不同颜色的最大数目。它取决于数字化时每个像素所占的位数,也就是用几位二进制数表示一个像素,即通常说的几位位图,如颜色深度为1(一位位图)则位图中每个像素用1位二进制数表示,那么它就可以有两种取值即黑白两种颜色;同样颜色深度为24,则每个像素可用24位二进制数表示,有224种不同取值即16772216种颜色,就是平时说的真彩色。④图像文件的大小图像文件的大小是指在磁盘上存储整幅图所占的字节数,可用下面的公式计算:文件字节数=图像分辨率(高×宽)×图像深度/8如一幅800×600大小的真彩色图片所需存储空间大小为800×600×24/8=1440000B。由此可以看出,位图图像文件所需存储空间很大,存储时必须采用压缩技术。2.矢量图形(1)矢量图形的概念。矢量图形是用一组指令集合来描述的,这些指令用来描述构成一幅图的所有直线、圆、矩形、曲线等的位置、形状、维数和颜色等各种属性和参数。显示时,需要相应的软件读取、解释这些指令,并将其转换为屏幕上所显示的形状和颜色。如要在屏幕上画个矩形,从屏幕左上角开始,水平方向走300个像素,再往下走300个像素,同时记录边框的颜色、方框中填充的颜色。这样就完成了一个矩形的绘制。(2)矢量图形与位图图像的区别。矢量图形和位图图像都是静止的,与时序无关。①图形是用一组指令来描述画面的直线、圆、曲线等,而图像则是用画面中每个像素的颜色和亮度来描述的。所以图形很容易分解成不同单元,分解后的成分有明显的界限;而图像分解较难,各成分之间的分界往往有模糊之处,有些区间很难区分属于哪部分,彼此平滑的连接在一起。图形可以随意缩小放大不会失真,而图像不能则不能。②位图占用的存储器空间比较大。影响位图大小的因素主要有两个:图像分辨率和像素深度。分辨率越高,就是组成一幅图像的像素越多,则图像文件越大;像素深度越深,就是表达单个像素的颜色和亮度的位数越多,图像文件就越大。而矢量图文件的大小则主要取决图形的复杂程度。③矢量图与位图相比,显示位图文件比显示矢量图文件要快。尤其对于复杂图形,使用矢量图形计算机要花费很长的时间去计算每个对象的大小、位置、颜色等特性。矢量图侧重于绘制、创造,而位图偏重于获取、复制;矢量图和位图之间可以用软件进行转换,由矢量图转换成位图采用光栅化(rasterizing)技术,这种转换也相对容易;由位图转换成矢量图用跟踪(tracing)技术,这种技术在理论上说是容易的,但在实际中很难实现,对复杂的彩色图像尤其如此。3.图像文件的格式常见图像文件的格式有以下几种。(1)GIF格式是美国CompuServe公司于1987年制定的格式,目的是能够在不同的平台上交流使用,是Internet上的重要文件格式之一,支持64000像素的图像。(2)BMP格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式。Windows3.0以前的BMP位图

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功