视音频压缩编码技术的发展-PowerPointPres

chrismisa
1 ℃
2018-05-18

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

视音频压缩编码技术的发展北京广播学院信息工程学院电视工程系张琦主要内容一、数码率压缩编码基本技术二、现在应用的国际压缩标准三、MPEG编码标准的比较(一）MPEG-1（二）MPEG-2（三）MPEG-4（四）MPEG-7（五）MPEG-21一、码率压缩编码基本技术1、信源的数码率和压缩的必要性数字电视信号要求大容量存储器，传输数据率高。4：2：2采样，8bit量化时，为：216Mb/s，1GB硬盘存：1GB/27MB=37s的节目。结论：要使数字电视信号适合于实际存储和传输，必须压缩数据量，降低传输数据码率。•前提：压缩后图象质量要满足视觉要求。2、信源码率压缩的可能性信源数据存在各种冗余信息1）空间冗余：相邻象素、相邻行信号的相关性；2）时间相关冗余：相邻帧信号的相关性；可压缩内容：冗余量信息论表述：信息量＝数据量－冗余量；注：冗余—多余的、重复的。信息已经成为经济的战略资源，而数据压缩成为多媒体信息处理的关键技术。在多媒体的传输和处理中还有许多问题需要进一步解决。例如，如何提高网上传输图像和视频的质量，如何通过网络在世界范围进行信息交换？解决这些问题仍需要提高压缩编码效率、分级和实用的转码方法。3、压缩编码的意义4、MPEG码率压缩编码方式预测编码，变换编码，熵编码。（1）熵编码：是无损编码。熵编码要预先知道或估测不同事件出现的概率。熵编码对出现概率大的事件用短码字编码，反之用长码字编码，使事件的平均码长缩短，实现码率压缩。4、码率压缩编码方式（2）预测编码1）帧内预测编码将当前像素实际值与其预测值的差值进行量化编码称为预测编码。预测值由同一行前面的相临像素和上面相临行的相关像素来产生时，称为二维预测。二维预测可去除空间冗余。预测精度越高，编码效率越高。扫描方向4、码率压缩编码方式预测编解码系统框图解码器编码器输入Xe0e0′e0′QD1DNIQD1DNIQ4、码率压缩编码方式2）帧间预测编码帧间预测可去除空间冗余，差值概率分布更集中在0附近，可获更大压缩比。帧差信号帧间预测框图运动估计运动补偿帧存量化器反量化运动矢量，去接收端预测帧—链图4、码率压缩编码方式3)预测编码的意义：•画面上大部分是亮度变化缓慢的平坦部分和慢运动部分，空间和时间相关性强，差值信号很小；•大部分差值集中在0附近，传送差值信号减小了原数据幅值范围。•原图像信号的幅值分布概率均匀，而且差值的概率分布很不均匀，这就为后面的熵编码创造条件。差值与原图象的概率分布4、码率压缩编码方式4、码率压缩编码方式（3）变换编码变换编码，把空间域描写的图象变换到一个正交的变换域。空域的一个N×N个象素像块变成变换域的N×N变换系数块。变换仅是表示方法的变换。原象块中的象素之间相关性很强；而变换系数能量集中在直流和少数低频系数上，降低了冗余度。例，二维傅立叶变换，将空间域变换到频域，在水平和垂直方向上进行频谱展开。下图表示水平方向8个像素数据从时域到频域的变换：图像信号被分解成为直流、低频到高频各种余弦成分；DCT系数表示各频率幅度的大小；变换编码的基本系统：在存储器中将图象分成8×8的块，将块从空域变换到频域得8×8个系数F（u,v）。量化：对DCT系数进行量化，低频系数细量化，高频系数粗量化，并4舍5入，忽略接近或等于0的高频系数。将64个量化后系数进行游程编码，再VLC编码。接收端经解码、反量化和反变换恢复图像块。4、码率压缩编码方式变换编码系统框图分块DCT变换量化编码解码反量化反DCT变换块组合输入数据接收输出信道4、码率压缩编码方式图像内容DCT变换例•返回922-150-25-5-6-12-6-1-208-10624133-29312-32-1-20-191-3-633320-5-4212000-4651421-11-24-1143010230-3-1DCTDCT52100000000000000000000000000000000000000000000000000000000-158-4-100100DCT分块90blocks(720pixels)72blocks(576pixels)8pixels1DCTblockYsignalinoneframe8pixelsC(u),C(v)=1/u,v=0C(u)，C(v)=1u,v≠0f(x,y):变换前像素数据F(u,v):变换后的系数空域数据频域数据LeftRightUpperLowerLowHighLowHighxyuvTransformF(u,v)=(2/8)C(u)C(v)ΣΣ[f(x,y)COS{πu(2x+1)/16}COS{πv(2y+1)/16}]DCT(DiscreteCosineTransform)x=0y=0772每个系数都由原64个像素算出二维DCT的反变换（IDCT）x，y=0,1,…,N-11,...,2,1,,10,,21)(),(NvuvuvCuC每个重建像素幅值都由64个DCT系数算出8×8亮度块的DCT变换、量化例0i70u7j7dav7v7量化DCT变换0u70u7v798929580758268509791947974816749958992777279654793879075707763459185887368756143898386716673594187818469647157398579826762695537591106-1828-3414183350000000-1000000030000000-1000000000000000-10000000000000004010-22–1000300000000000000000000000000000000000000000000000000000001611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399bc量化表二维DCT变换的基图象去空间相关性8×8亮度块的DCT反变换、反量化处理例e反量化后的DCT系数f反DCT，重建像素样值g重建样值与原始值之差591110–2032–24000360000000000000000000000000000000000000000000000000000000989790818079675097968980797866499594877877776447939285767574624590898274727259438887807170695740868578706868553985847769676754380–55–1–53100–55–1–53100–55–1–52100–55–1–53101–46–1–43201–460-44211–46–1–43200–55–2–521-1efgDCT系数的量化DCT本身并不能进行码率压缩，DCT只是降低相关性（冗余度）。数据压缩从量化开始。量化对每个系数分别用大于1的数去除，对除得到的系数取整数，人眼对低频敏感，对高频不太敏感,对低频分量采取细量化，对高频分量采取粗量化，高频分量会多数变0。丢弃低能量高频系数不影响重建图像的主观质量。改变量化系数可改变压缩比。量化是有损压缩，产生块效应块效应ACcomponentsaredividedby2DC2222222222222222222222444444444444444444444ACcomponentsaredividedby4LowHighLowHigh自适应量化例SensitiveforhumaneyesLesssensitiveforhumaneyes2、4：量化系数231-74-12-2-3-5-20-102-5312011-13141-110-10-90-1-211110-2-2101000-222011000-110011000110-10231-74-12-1-1-2-10-102-5101000-137000000-400-100000-1-1000000-11100000000000000000000自适应量化结果AdaptiveQuantization量化系数的实际确定方法量化系数的获得过程：根据对大量能代表电视节目素材的各种图像序列进行主观评价的结果，对大量的量化系数进行优化，使图像的主观损伤最小，最后确定一系列具有代表性的量化系数。量化系数选择：根据应用目的、性能、低延时、复杂度和价位等要求，在一些系数中选择。231-74-12-1-1-2-10-102-5101000-137000000-400-100000-1-1000000-11000000000000000000000Zig-zag扫描之字形扫描231-74-12-1-1-2-10-102-5101000-137000000-400-100000-1-1000000-11000000000000000000000EOB(EndOfBlock)EOBEOBistransmittedinsteadofzeros游程长度编码(RLC)为解决连0的表达方式采用游程编码。在量化的DCT交流（AC）系数中，将每一串连0系数与其后面的一个非0系数组成一个数组，并用一对符号表示：符号1符号2（游程长度Run,位长）（幅值）游程长度：非零系数前连0的个数；幅值：非零系数值。例如，下图其游程长度编码结果：(25),（0,4)(10),（0,2)(3）,(2,2)(-2),(0,2)(2),(7,1)(-1),(0,0)第一个数是直流（DC）系数。游程编码使64个系数只需7对符号，用7个码字表示即可。游程长度编码(RLC)图返回信息：反映客观事物的存在状态或变化规律。信息量：香农信息论：信息量＝数据量－冗余量，与事件出现的概率有关。从N个概率相等的事件中选出一个事件所得的信息量信息熵：若N个事件（符号）中的每个事件之概率不相等，则每个事件所含的信息量不等，并由其概率决定，概率小者信息量大。每一个事件所携带的平均信息量称为熵（H）。熵编码，是可变长编码。通过合理的比特数分配使信号字长与概率相匹配，对概率大的符号给短码，对概率小的给长码，以缩短平均字长。（5）熵编码)(/1loglog)(22xPNxI符号/log1log2121bitPPPPHiiniiini比特霍夫曼编码游程编码后的熵编码多用霍夫曼编码（VLC)。编码标准提供霍夫曼码表，根据游程编码得到的符号直接查表，得到相应的码字。码表是根据概率分布并对大量典型图像素材进行统计制成的游程编码后的熵编码对符号1中的数据，从亮度和色度的系数码表查出霍夫曼码；符号2中的数据仍用自然二进数编码，也称可变长整数（VLI）编码，码字长度也是可变的；直流系数DC采用与相邻像块DC的差值编码；对前面图中的游程编码结果进行熵编码，结果是：11011001101110100111111110010101101111101001010图压缩比计算以上由64个像点样值编码所得数据的总位数是47。可用抽样位率表示压缩程度，即用平均每个像点占用多少位来表示。对于此8×8像块的抽样位率计算如下：也可以用压缩比CR来度量压缩程度。本例按原图象用8比特量化的8×8像块计算，可得压缩比为：样点位抽样数总位数抽样位率/730644791047888压缩后的总位数压缩前的总位数压缩比CR视频缓冲校验器•一个编码器输出的数据流码率不是恒定的，输出码率高低取决于：量化步长、原图象的复杂度。•向通道馈送的码率必须是恒定的。•视频缓冲校验器作用：编码器输出必须有一个视频缓冲校验器VBV，暂存码率不恒定的输入数据流，受控以恒定码率向通道输出压缩数据流，起缓存数据和平滑码率的作用。•码率控制：用缓存状态控制量化器，调整量化步长，防止缓存溢出。TM5SRC码率控制DCT压缩编码简图多媒体数据能被压缩多少？•估计