数字电视4

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

上海交通大学数字电视原理与应用PrincipleandApplicationofDigitalTelevision主讲:张文军教授上海交通大学电子信息工程学院Email:zhangwenjun@sjtu.edu.cn2006~2007学年第一学期MPEG-2音频编码及其测量,class042数字电视原理与应用课程安排1数字电视概述•电视技术的发展历程•模拟电视原理•数字电视的发展2数字电视基本原理视频压缩原理MPEG-2视频编码及测量MPEG-2音频编码及测量MPEG-2系统及其测量数字调制基础数字电视的纠错编码原理3数字电视相关标准•DVB-S标准及相关测量•DVB-C标准及相关测量•OFDM技术•DVB-T标准及相关测量•ATSC和ISDB-T标准及其测量•我国的数字电视标准MPEG-2音频编码及其测量,class043数字电视原理与应用数字电视基本原理视频压缩原理——第5章MPEG-2视频编码部分及其测量——第4,6,11章MPEG-2音频编码及其测量—第7章MPEG-2系统部分及其测量——第3,9,10章数字调制基础——第12章数字电视中的纠错编码原理——补充MPEG-2音频编码及其测量,class044数字电视原理与应用MPEG-2音频编码及其测量1.数字音频源信号2.音频编码历史3.人耳心理声学模型4.音频编码的基本原理5.子带编码6.变换编码MPEG-2音频编码及其测量,class045数字电视原理与应用人耳动态范围大约140dB,听觉带宽最大20kHz。在模拟音频信号采样数字化之前,要经过低通滤波器进行带限。然后进行模数转换:采样分辨率至少16bits采样频率:•32kHz——MPEG标准仍支持,但已经不用•44.1kHz——音频CD•48kHz/96kHz——演播室质量16bit48kHz采样的码率每个信道786kbit/s,立体声信号近似码率为1.5Mbit/s1、数字音频源信号图7.1数字音频源信号15~20kHzBW15~20kHzBWAD32/44.1/48kHz音频采样频率AD32/44.1/48kHz音频采样频率RightLeft16bitUpto768kbit/s16bitUpto768kbit/s1.5Mbit/sCompression100~400kbit/sMPEG-2音频编码及其测量,class046数字电视原理与应用音频压缩的目标是将1.5Mbit/s码率降低到100~400kbit/sMP3音频文件通常码率为32kbit/s与视频压缩相似,音频压缩也有两种方式:冗余度消除——省略多余信息,无损不相关性消除——省去接收端(人耳)不能察觉的信息,有损所有音频压缩方法基于心理声学模型,利用人耳的不足,消除音频信号中的不相关信息。人耳不能察觉频域和时域中强声音脉冲邻近的声音对人耳而言,某些声音可以掩盖其他低幅度的声音信号。1、数字音频源信号MPEG-2音频编码及其测量,class047数字电视原理与应用MPEG-2音频编码及其测量1.数字音频源信号2.音频编码历史3.人耳心理声学模型4.音频编码的基本原理5.子带编码6.变换编码MPEG-2音频编码及其测量,class048数字电视原理与应用MASCAM1988,InstitutfürRundfunktechnik(IRT)为DAB(digitalaudiobroadcasting)系统提出MUSICAM(maskingpatternuniversalsubbandintegratedcodingandmultiplexing)1989,CCETT,Philips和Matsushita联合提出用于DAB上两种都基于子带编码,音频信号分成大量子带,每个子带进行或大或小程度的不相关性消除。ASPEC方法FraunhoferGesellschaft和Thomson提出基于变换编码利用DCT将时域音频信号变换到频域,然后消除不相关性信号分量。2、音频编码历史MPEG-2音频编码及其测量,class049数字电视原理与应用子带编码的MUSICAM和变换编码的ASPEC都包含在MPEG-1音频压缩标准(1991ISO/IEC11172-3)中,分为3层:LayerI和II——MUSICAM编码LayerIII(MP3音频文件)——ASPEC编码•MP3不是MPEG-3,MPEG-3起初为实现HDTV,但HDTV后来集成到MPEG-2,所以MPEG-3不存在。MPEG-2音频(1994ISO/IEC13818-3)在MPEG-1基础上又增加了layerIIMC(multichannel)2、音频编码历史MPEG-2音频编码及其测量,class0410数字电视原理与应用子带编码2、音频编码历史MASCAMIRTMunich,1988MUSICAMIRT,CCETT,Philips,Matsushita,1989DCT变换编码ASPECFraunhoferGesellschaft,Thomson声道LayerI,低复杂度,低压缩比LayerII,中复杂度LayerIII,高复杂度,高压缩,子带和变换编码,mp3ISO/IEC11172-3MPEG1音频,1990/91ISO/IEC13818-3MPEG2音频,1994LayerI,II,III与MPEG-1相同LayerII,MC(5.1声道)MPEG-2音频编码及其测量,class0411数字电视原理与应用美国Dolby实验室提出的Dolby数字音频标准(AC-3)1990年提出,1991年12月,第一部AC-3音频编码电影“StarTrackVI”公映许多电影采用Dolby数字技术。美国数字地面广播ATSC只采用AC-3音频编码。其他一些国家(如澳大利亚)将同时采用MPEG和AC-3音频。MPEG和AC-3音频的质量基本没有差别,现代MPEG解码芯片支持两种方法。DVD同时支持PCM音频、MPEG音频和AC-3音频编码。2、音频编码历史MPEG-2音频编码及其测量,class0412数字电视原理与应用AC-3的应用电影ATSCMPEG-2TS流DVDAC-3基于MDCT(modifiedDCT),5.1声道,每声道128kbit/sMPEG支持新音频编码方法:MPEG-2AAC(advancedaudiocoding)ISO/IEC13818-7MPEG-4ISO/IEC14496-3(自然/合成音频对象)MPEG-7ISO/IEC159382、音频编码历史MPEG-2音频编码及其测量,class0413数字电视原理与应用MPEG-2音频编码及其测量1.数字音频源信号2.音频编码历史3.人耳心理声学模型4.音频编码的基本原理5.子带编码6.变换编码MPEG-2音频编码及其测量,class0414数字电视原理与应用冗余度降低(无损)和不相关性降低(有损)可以将原始声音信号码率降低90%。不相关性降低依赖于人耳的心理声学模型——Zwicker教授知觉编码——人耳不能分辨的声音分量不传输。人耳剖面图,分为三个主要部分:外耳、中耳、内耳。3、人耳心理声学模型图7.3人耳剖面图MPEG-2音频编码及其测量,class0415数字电视原理与应用3、人耳心理声学模型外耳实现阻抗匹配功能,声音通过空气传输,类似3kHz区域回声递升滤波器。人耳灵敏度最高的范围正是:3kHz~4kHz。耳膜或鼓膜将声波转换为机械振动,通过锤骨、砧骨、镫骨传送到通向感觉内耳的膜状窗。耳膜前后的空气压力必须相同,这由耳膜后面的咽鼓管来保证,咽鼓管使得该区域与咽部相连通。当我们到很高的高度时,耳内会有很大压力,通过吞咽动作,咽鼓管内的黏膜可以补偿压力。图7.4人耳的技术模型外耳鼓膜锤骨中耳耳咽管听觉神经高频接收器隔膜内耳低频接收器图7.3人耳剖面图MPEG-2音频编码及其测量,class0416数字电视原理与应用内耳有平衡器官,由几个充满液体的弓形和耳蜗构成。耳蜗是真正的听觉器官,直接听到声音。如果展开耳蜗会在其入口处发现高频传感器,然后是中频传感器,最末端是低频传感器。耳蜗由一个螺旋型管道组成,内部有一个更小的膜状螺旋型通道,从前到后越来越宽。内耳膜上分布着频率选择、声音采集传感器,将听觉神经连接到大脑。3、人耳心理声学模型图7.4人耳的技术模型外耳鼓膜锤骨中耳耳咽管听觉神经高频接收器隔膜内耳低频接收器图7.3人耳剖面图MPEG-2音频编码及其测量,class0417数字电视原理与应用3、人耳心理声学模型听觉神经传送的电信号幅度近似为100mVpp,电脉冲的重复率为1kHz数量级,这个速率包含的信息是某个频率音调的音量。音调的音量越高,重复率越大。每个频率传感器通过一个独立的神经线与大脑通讯。传感器的频率选择性在低频处最大,随频率升高而降低。图7.5人耳的机械/电子模型MPEG-2音频编码及其测量,class0418数字电视原理与应用与音频编码相关的人耳特性人耳的灵敏度在很大程度上依赖于频率。低于20Hz,高于20kHz的声音信号人耳无法听到。人耳最敏感范围为3kHz~4kHz,在该范围之外,人耳敏感度向高频和低频两个方向降低。低于某个阈值的声音人耳无法听到,该阈值取决于频率,声音信号中低于该阈值的分量无需传送,对人耳而言是不相关信息。图7.6听觉阈值与频率关系MPEG-2音频编码及其测量,class0419数字电视原理与应用与音频编码相关的人耳特性掩蔽现象:例如一个测试人员听一个幅度固定的1kHz正弦波,同时添加其他不同频率和幅度的正弦波,发现在1kHz附近低于某个阈值的其他正弦信号听不到,该阈值取决于频率,称作掩蔽阈值。掩蔽阈值曲线取决于掩蔽信号的频率,掩蔽信号的频率越高,被掩蔽的范围越大。这一特性叫做频域掩蔽。在掩蔽阈值以下的声音分量不需传送。图7.7频域掩蔽图7.8掩蔽阈值MPEG-2音频编码及其测量,class0420数字电视原理与应用与音频编码相关的人耳特性时域掩蔽时域中一个强脉冲会掩蔽该脉冲前后低于某个阈值的声音信号。这种现象,尤其是前掩蔽,很难想象,但可以进行很好的解释。是由于人耳的有限时域分辨率,再加上信号通过听觉神经传输到大脑的方式。目前的音频压缩方法只利用了频域掩蔽。图7.9时域掩蔽MPEG-2音频编码及其测量,class0421数字电视原理与应用MPEG-2音频编码及其测量1.数字音频源信号2.音频编码历史3.人耳心理声学模型4.音频编码的基本原理5.子带编码6.变换编码MPEG-2音频编码及其测量,class0422数字电视原理与应用4、音频编码的基本原理量化噪声:对完全调制正弦信号进行模数转换,由于量化噪声的影响,分辨率为Nbits时的信噪比约为6NdB(经验值)8bit分辨率的信噪比为48dB16bit分辨率的信噪比为96dB音频信号通常采样分辨率为16bit或更高16bit分辨率仍然不能满足人耳的动态范围140dB图7.10基于知觉编码的音频编码原理框图FilteringprocessTime:fineFrequency:coarseSubbandQuantizerDataCodingSpectrumAnalysisTime:coarseFrequency:finePsycho-acousticmodelCompressedAudiooutRedundancyreductionIrrelevancyreductionFrequencySubbandsAudioinMPEG-2音频编码及其测量,class0423数字电视原理与应用数字声音源信号在编码器中分为两个分支:滤波•将声音信号经过滤波分为许多子带。•如果某个子带的信号值低于掩蔽阈值,该子带被其他子带完全掩蔽,不需传送,该子带信息对人耳完全不相关。•滤波过程的时域分辨率必须足够高,否则会丢失时域信息;相应只需较低的频域分辨率。频谱分析•通过FFT进行频谱分析。

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功