75第十二章视频压缩国际标准12.1JPEG标准12.1.1背景JPEG专家组成立于1986年底,目的是为连续色调静止图像压缩制定国际标准。1987年6月用电视测试图像(720×576,Y:U:V=4:2:2;每像素16bit,宽高比4:3)进行了重现测试。12.1.2算法1.JPEG提供了3种压缩算法:基本系统、扩展系统和无失真压缩。所有的JPEG编码器和解码器必须支持基本系统。2.基本系统基于DCT可变长编码(VLC)压缩技术,可提供100:1的压缩比。由于DCT编码有失真,故重建图像不能精确再现原图像,失真度与压缩比有关。码率(bit/pel)图像质量0.25—0.50中等-好0.50—0.75好-很好0.75—1.5极好1.5—2.0与原始图像几乎一样12.1.3基本系统1.基本系统框图JPEG建议的基本系统框图如下(单个分量):(1)首先将待压缩图像分成8×8子块,再用DCT将各子块转换成8×8DCT系数阵列;然后用一个8×8的量化值阵列对这些系数进行量化,由熵编码DCT量化熵编码熵解码反量化IDCT表说明表说明表说明表说明II’压缩图像图12.1.3-1基于DCT的编/解码器框图76器将量化后系数值依次转换了数据码流C。解码是相反过程。(2)若熵编码器无信息损失,则重建图像子块及I’与原子块I的差异完全由DCT、量化、反量化及IDCT引入的。(3)当有传输误码时,标准提高了额外的FEC技术,以便从误码中恢复发端码流C。2.基本系统的实现(1)二维DCT。8×8的DCT为)13.1.6(16)12(cos16)12(cos),()()(41),(7070lnkmnmXlCkClkYmn二维IDCT为)23.1.6(16)12(cos16)12(cos)()(41),(7070kllnkmlCkCnmX若为8bit精度图像,则X(m,n)元素的动态范围为(-128——127),而系数Y(k,l)元素的动态范围为(-1024——1023)。(2)Y(k,l)的量化a.量化变换函数Q(k,l)Y(k,l)量化——C(k,l),则)33.1.6(0),(),(]2/),(),([0),(),(]2/),(),([),(lkYlkQlkQlkYlkYlkQlkQlkYlkC显然,若输入为Pbit精度,则Y(k,l)为(P+3)bit,量化后为P+3-log2Qbit反量化变换为)43.1.6(),(),(),(lkQlkClkYε=Y-Y’,量化过程引入的不可逆信息损失。b.考虑视觉效应的量化阶(1)就Y(k,l)的交流系数(AC)而言,其主观评价并非等权的。一般而言高阶AC系数可以粗量化。根据精度及质量要求,设计量化表,但在JPEG建议将此项工作放在标志信息中,如亮度量化表、色度量化表。(2)编码模型77DCT的系数编码有两类:a.DC系数采用DPCM编码b.AC系数编码——阈值编码量化系数阵为一个稀疏矩阵,DC系数在左上角,非零系数较少,可以重组为一个一维数组Z。(3)熵编码JPEG建议有两种熵编码方法:a.霍夫曼编码注意霍夫曼编码表(AC系数的)b.二进制算术码(4)应用程序——软压缩——硬件IC压缩12.2H.261建议12.2.1背景及概念1.背景1984年成立CCITT的电视电话及会议电视的编码建议专家组,1990年12月批准了H.261标准。H.261简称P×64,当P=1、2或,码率最大为128kbps,不能传输清晰图像——电视电话;P≥6时,码率≥384kbps,适用于会议电视。2.图像格式(1)H.261采用通用中间格式CIF——为了与PAL、NTSC、SECAM方便转换,码率较低。(2)CIF——亮度分量Y的水平像素为352个,垂直像素为288个。——色度CB,CR的水平/垂直像素为亮度的一半。——外形宽高比为4:3,与常规电视一致。——Y分量的像素面积等于色度分量像素的面积,故色度分量的清晰度比亮度分量的清晰度低。——相当于场为288扫描线。取为PAL及NTSC制的平均值。(625/2+525/2)/2=287.5≈288(3)P=1、2时,CIF专门定义了传输低码率内容的QCIF格式,即1/4CIF格式。——Y:水平176,垂直14478——CB,CR:水平88,垂直72QCIF为最低要求。12.2.2视频编解码12.2.3信源编码器首先DCT——DCT系数量化——复用编码(分为4个层次数据结构),加入辅助数据。交流DCT系数VLC(可变长),直流系数定长FLC编码——传输缓冲器——将变码率码流变换成固定码率码流,并控制编码控制器——传输编码插入BCH前向纠错码,以消除传输中的误码。1.帧内/帧间编码(1)帧内帧电视电话/会议电视的帧频为每秒30帧,相邻帧的内容由于是渐变的,有很强相关性。因此允许每两个传送帧之间可以有3帧不传。每次场景更换后,第一帧必传,所传帧称为帧内帧(Intraframe-IF),应进行帧内编码。图像信源编码图像复用编码传输编码器编码控制器传输缓冲外部控制码流(a)图像编码信道图像传输解码接收缓冲图像复用解码信源解码(b)图像解码79(2)帧间编码a.第一帧为I帧b.第五帧为P帧——预测帧,由第一帧和第五帧本身经过预测编码得到,P帧本身也可以作为下一个P帧预测编码的基础。c.图中B帧为双向预测帧,由邻近I、P帧或P、P帧双向预测所得。d.通常,12帧或15帧传1帧I帧,每3帧或4帧中传1个P帧,场景变化后第1帧为I帧。例如:第2帧B帧B=(3/4)I+(1/4)P,下一帧B=(I+P)/2e.编码控制器控制选择帧内/帧间编码方式。变换系数量化索引+-编码控制器帧内/帧间标记发送与否标记量化器指示运动矢量环路滤波器开关指示码流视频ΣΣDCT量化反量化IDCT环路滤波运动补偿帧存视频复用编码器IBPBBBB80(3)DCT变换a.采用8×8像素块为子块单位,8bit量化。注意亮度信号要平移128电平单位。b.DCT后,低频系数在左上角,高频在右下角。(4)量化器a.量化公式)12.2.12(2),(),(SqvuFINTvuQF(u,v)——变换系数q——量化步长,q大码率低,q小码率高S——符号位,S=0正值,S=1负值b.反量化)22.2.12(),(2),(vuQqvuF上式中S=1应加负号(5)运动补偿a.帧内、帧间判断将前1帧图像储存在帧存储器中,下1帧图像到达时,比较前后两帧图像的相关性,相关性强为帧间编码,相关性弱为帧内编码。设前1帧亮度信号像素值为P(x,y)表示,下1帧亮度值为C(x,y),则前1帧亮度信号方差为)32.2.12(),(2561),(256121611611611612yxyxaroryxPyxPV16——宏块MB是由4个子块(8×8)组成。前后帧的像素值为)42.2.12(),(),(25611611612yxaryxPyxCV上式反映了相关性的大小。Var小,相关性大。判据:Var≤64,帧间模式Var>64,Varor≥Var时为帧间模式Var>64,Var>Varor时为帧内模式81若为帧内模式,该MB进行DCT变换和量化。若为帧间模式,该MB属P帧,则要进行运动估值编码,若不传,属B帧。b.运动估值运动矢量定义为)52.2.12(),(),(),min(),(161161yxvyhxPyxCvhVHMVh,v表示水平/垂直方向搜索的像素数,最小的h,v值意味着最佳匹配。需传送的仅为运动矢量信息。(6)环路滤波器——空间的二维低通滤波器——消除高频噪声——通常运用在帧间运动补偿时,消除像素边缘噪声。(7)输出信号a.帧内/帧间量化DCT系数。b.帧内/帧间模式选择信号。c.量化步长信息。d.图像传送与否指示信号。e.宏块MB帧间运动矢量。f.环路滤波是否使用指示信号。因此,H.261建议的信源编码器功能可以有:a.可以跳帧。b.可以逐个宏块模式。c.每帧可存贮后与下帧比较作模式判定。d.帧存在存储3帧以上的情况下,可以进行第1、5帧的预测误差计算。e.P帧内,部分宏块MB可以采用帧内模式。f.场景突变后,可以抓住第1帧进行帧内编码,给编辑人员发挥能力的余地。(8)解码器a.帧内模式由信道来的宏块MB量化DCT系数进行反量化,同时送入量化步长q)62.2.12(),(2),(vuQqvuF82在S=1时为负值,上式经IDCT后得像素值'f(x,y),送入加法器,一路输出,一路送帧存储。b.帧间模式信道传送来的为量化DCT预测误差,经反量化及IDCT后得预测误差ε(x,y),将(H,V)——运动矢量,将前帧匹配信号P(x+H,y+V)从帧存中取出送入环路滤波器,乘滤波系数得PF(x+H,y+V)输出图像为)72.2.12(),(),(),(VyHxPyxyxfF12.2.3图像复用编码器1.数据层次每1帧图像数据分3层,即数据块B,宏块MB和帧块组GOB。a.B包含8×8像素,亮、色信号的基本编码单元。b.宏块MB——含4个亮度B块,及CB,CR各一个B块,在宏块MB中,Y,CB,CR描述同一像区。c.块组GOB包含33个宏块MB,横向有11块MB,纵行3行。12…………10111213…………2122IDCTDCT系数Q-1Σ输出各帧图像运动矢量(H,V)环路滤波帧存运动补偿滤波器开关信号q-步长832324…………3233GOB中宏块顺序按照CIF格式,1帧CIF图像=12GOB=12×33MB=12×33×6B=2376B=1584B(Y)+396B(CB)+396B(CR)=152,064像素而1帧图像中12块组GOB排列为d.上述顺序设计主要为了数据交换与设备兼容性考虑。2.复用编码交换系数——每块有8×8个数据左上角为直流系数,其它为交流系数,采用Z形扫描将数据排列成串126715162829358141727304349131826314244122456······1112CIF123QCIF帧头GOB帧层次GOB…………………GOB头MBGOB层次…………………MBMB头BMB层次B…………………TCOEFFEOBB层次…………TCOEFF8410121925324145541120243340465355212334394752566122353848515760623637495058596364Z形扫描12.2.4传输缓冲器1.目的——协调编码输出率和网络比特率,充分利用网络的传输比特率。2.原理——编码输出比特率高时,缓冲器作为存贮器,同时通知编码器提高量化步长;反之,降低量化步长,使码率提高。3.容量——12.2.5传输编码器1.目的——消除传输误码的影响。2.方法——加入前向BCH纠错码。12.3MPEG1标准12.3.1背景与概念1.背景MPEG1由ISO与IEC共同制定,编号为ISO/IEC11172,“码率为1.5Mbps时,用于数字存贮媒体的运动图像及其伴音的编码”,分为3个部分。(1)系统——11172-1——建议了几种伴音压缩数据和图像数据的复用,及加入同步信号后的整个系统。(2)图像——11172-2——重点讨论内容。(3)伴音——11172-3——建议数字伴音压缩,共有64,128,192kbps3种码率。2.MPEG1的任务——完成图像、伴音、存贮和传输4个方面兼顾。——质量适当的编码数据应成为计算机多媒体数据中的1种,能兼容其它数据。——必须在计算机网络及广播电视网络中兼容传输。3.MPEG1的基本目标(1)音像质量方面——高于会议电视图像质量85(2)存贮媒体——光盘、数字录音带DAT、硬盘、可写光盘。(3)传输码率——1~1.5Mbps码率,是PC及CD-ROM目前的传输码率。(4)通讯网络——适应多种网络,如ISDN、LAN等。(5)满足不对称及对称应用——不对称