本单元的内容量化变换编码预测编码本单元的内容量化变换编码预测编码一个典型的信号压缩系统如图所示为什么要量化一个典型的信号压缩系统如图所示。为什么要量化通过时间轴上采样和幅度量化将连续信号变成离散数字信号一个典型的信号压缩系统如图所示。为什么要量化通过时间轴上采样和幅度量化将连续信号变成离散数字信号一个典型的信号压缩系统如图所示。为什么要量化通过变换将信号的能量集中在少数几个变换系数上去除信号中的相关性一个典型的信号压缩系统如图所示。为什么要量化信号压缩真正体现在量化阶段一个典型的信号压缩系统如图所示。为什么要量化一般先是行程编码,然后Huffman编码或算术编码进一步提高压缩比量化之前需要规定量化级,比如8级,16级等量化时将取样值与量化级比较,若取样值在某个量化级的覆盖区间之内,则规定它取这个量化级的代表值,我们称其为码字。一个量化器只能取有限多个量化级,从而量化过程不可避免地会引起量化误差。量化原理量化器定义设编码操作在Rk上进行,X为在Rk上给定了概率分布函数的一个随机向量。x为X的取值。A是随机向量取值空间,则A的一个N级量化器Q={Y,}由以下三部分组成:kAR码本集:{;1,2,,}iYyin对A的分割:1{;1,2,,},,NiiiRiNRA:({|})iiQAYyQxxR由下式定义的映射:在以上定义中,当k1时,所定义的是向量量化器;当k=1时,即为标量量化器。例如:码本集:Y={y1,y2,…,yN}分割依Y将R划分为N个子空间R1,R2,…,RN,且1NiiRRRi的区间表示为Ri=[xi,xi+1),i=1,2,…,N产生的量化误差定义为()({|})iiyxQxxR()()iexQxxyx量化器定义量化可以分为两类:(1)标量量化:输入信号的所有分量使用同一个量化器进行量化,每个分量的量化都和其它分量无关,也称为零记忆量化。(2)矢量量化:从码本集合中选出最适配于输入信号的一个码字作为输入信号的近似,这种方法以输入信号与选出的码字之间失真最小为依据。矢量量化与标量量化相比有更大的数据压缩能力。矢量量化也可以与其他的编码方法一同使用。矢量量化常常是与变换编码相结合使用,在图像进行变换之后,按一定方式形成多维向量组,然后到码本中寻找最佳码字。量化分类标量量化标量量化:均匀量化(恒定量化步长)非均匀量化(量化步长可变)带死区的量化:当称为死区[,),()0xQx[,)均匀量化标量量化标量量化的输入/输出特性采用阶梯形函数的形式输出输入输出输入带死区的量化器标量量化非带死区的量化器输出代表点集Y={y1,y2,…,yN}存在一种最优分割φ依Y将R划分为N个子空间R1,R2,…,RN,且Ri的区间表示为Ri=[xi,xi+1),i=1,2,…,N如果φ是最优的,yi是Ri的质心。标量量化是将区间上的点映射为质心的操作,产生的量化误差定义为()({|})iiyxQxxR()()iexQxxyx最优标量量化器定义1NiiRR均方误差为22(())()exQxpxdx1221()()iiNxeixixypxdx最优量化是使最小,就可得如下解:111()/2(1)()()(2)kkkkkkkxxkxxxyyyxpxdxpxdx(1)(2)是非线性方程组,Lloyd给出了一种迭代法,给出了数值解。当均匀分布时,就构成了最优均匀标量量化器:111(1)/2()/kkkNxxkqyxqqxxN220,1,2,...,10,1,2,...,ekekkNxkNy最优标量量化2eLBG算法LBG算法希望设计一个具有K维N码字的码本空间的向量量化器,给出一个初始码本000012{,,,}NYyyy其对应的量化器记为Q0若能找到一种新的码本111112{,,,}NYyyy其对应的量化器记为Q1。111000(){(,())}(){(,())}DEdDEdQxQxQxQx则称量化器被优化了一次。重复这个过程我们去寻找Y2,Y3,…,Ym1)初始化,给定N,ε0,假设初始码本及训练集分别为000012{,,,}LYyyy2)对于12{,,,}mmmmLYyyy,对训练集进行划分,将训练集分为3)如果停止,并令为最终码本4)令形成新的码本否则继续。{,1,2,...}kkNx{,1,2,...,}mkCkL(,)min(,)mmjmmliljddyYxyxymliCx11min(,)mmjNmmljlDdNyYxy1mmmDDD11{,1,2,...,}mmkkLYy11mjkmkjmCkCxyxmiC划分的原理为:12{,,,}mmmmLYyyy转向2)其中是中矢量的个数miCLBG算法如果那么并计算LBG算法的局限性最优量化器是对于训练向量集而言的,对于实际的未经训练的输入向量是否还是最优的却很难说,这要依赖于训练向量集的代表性到底真实到何种程度。由于优化分割的过程并没有依据什么数据结构方面的规则或限制,而是自由进行,这就使得对码本进行有效组织时遇到了极大的困难。在某些情况下根本无法找到真正具有代表性的训练向量集。用LBG算法对Lenna图像进行向量量化的结果,压缩后PSNR=25.21dB本单元的内容量化变换编码预测编码为什么变换变换是信号实现时域和变换域(频域)映射关系的运算通常经正变换将信号在变换域分解,然后由反变换重建信号:当有11nnnnsTx111ˆˆnnnnxTs11ˆnnss11ˆnnxx当,有为什么变换变换的本质就是将信号在一组基函数上投影,得到一组投影值,即信号的变换域表达。变换的目的就是将一个实际的物理信号分解为变换域(频域)上有限的或无限的小的信号“细胞”,以便了解信号的性质,提取信号的有用信息现有图像/视频编码国际标准的基本框架都是采用预测、变换、熵编码等技术将图像/视频信号压缩成一定码率的码流,其核心技术之一是变换。变换是对信号改造和加工的过程,它有助于去除信号中冗余(相关性)和实现信号能量集中,正是图像/视频编码技术的理论基础。实际应用中通常采用正交变换。为什么变换1u2u1v2vo1212uu123212vv-0451212311121112221vvuuvT-图像/视频压缩处理中常用的变换包括:离散傅里叶变换DFT离散余弦变换DCTKarhunen—Loeve变换KL离散小波变换……KL变换由于去除信号中的相关性最彻底,因而被称为“最佳变换”。但KL变换的基是不固定的,需要存储变换基,计算复杂性高,使得KL变换的应用不现实。为什么变换为什么变换图像/视频压缩处理中常用的变换人们发现在信号满足一阶马尔科夫过程时,DCT是KL变换的很好的逼近。DCT有固定的基与明确的物理含义,使得DCT广泛应用于图像/视频压缩,成了变换编码的主要工具。静止图像压缩编码的国际标准JPEG和视频编码标准H.264都采用了DCT变换编码为什么变换变换通过将信号的能量集中在少数变换系数上给出信号的紧致表达,便于后续的压缩处理。对于图像而言,采用符合人的视觉系统特征的量化方式,大多数高频系数在量化后会很小或者为零,量化后的变换系数矩阵变成了一个稀疏矩阵。选择适当的扫描方式将二维矩阵表示的系数表示为一维向量,使得一维向量表示的系数具有零系数连续出现的特点,这样通过行程编码可以得到高压缩比。Karhunen—Loeve(KL)变换以图像统计特性为基础的一种正交变换,也称为特征向量变换或主分量变换KL变换的目的:去图像的相关性相关性:用协方差矩阵度量以下图像为例描述KL的算法KL变换KL变换一幅256×256图像分成1024个8×8的块每个8×8的块按照行(或列)的顺序排成一个64维的向量向量的维数定义随机向量使得其取值范围为iXn=64011{,,...,},1024MXXXM-=X011{,,...,}MXXX-KL变换KL正变换KL逆变换A是正交矩阵,mx是向量X的平均值101MxiimXM-==å()xYXm=-ATxXYm=+A{}xmEX=KL变换KL正变换KL逆变换A是正交矩阵,mx是向量X的平均值101MxiimXM-==å()xYXm=-ATxXYm=+A{}xmEX=如何选取A101()()MTxixixiXmXmM-==--åC{()()}TxxxEXmXm=--C111100001111MMMMTTTTiixiixxxiiiiXXmXXmmmMMMM----=====--+邋邋111100001111()()MMMMTTTTiixiixxxiiiiXXmXXmmmMMMM----=====--+邋邋1TT01MTTiixxxxxxiXXmmmmmmM-==--+å1T01MTiixxiXXmmM-==-å[]******轾犏犏犏犏犏犏犏臌向量X的协方差矩阵{()}xEXm=-A{()()}TyyyEYmYm=--C{}ymEY={}xEXm=-AA0xxmm=-=AA{}TEYY={(())(())}TxxEXmXm=--AA{()()}TTxxEXmXm=--AA{()()}TTxxEXmXm=--AATx=ACA01210121{,,...,}{,,...,}nneeeellll--,,,[]101011...MTTyxnTeeeeeeCC--轾犏犏犏=犏犏犏犏犏臌[]101011...MTTyxxxnTeeeeeeCCCC--轾犏犏犏=犏犏犏犏犏臌[]100011101111...nTTynTnneeeeeeCllllll----轾轾轾犏犏犏犏犏犏犏犏犏==犏犏犏犏犏犏犏犏犏犏犏犏臌臌犏臌为Cx的特征向量和相应的特征值,特征向量已正交化处理0121[,,...,]TneeeeA-=,A的定义实对称矩阵可正交相似对角阵,Cx是实对称矩阵1T-=AA不妨将特征值按照递减的顺序排列0121[,,...,]TneeeeA-=,降维重构的误差?1T-=AA()xYXm=-A0121,...,nllll-吵吵TxXYm=+A0121[,,...,],JTJJneeeeA-=,()JJxYXmA=-ˆJTJxXYmA=+112001ˆ{}nJniiiiiiJEXXelll--===+=-=-=邋?原图像的重构(无损)原图像的降维重构(有损){}TyCEYY=Tx=ACA0121(,,,...,)ndiagllll-=2ˆ(,)(,)(,)(,)(,)2TTTTJJJJTTTTTTTTJJJJJJJJTTTJJJJTTJJXXYYYYYYYYYYYYYYYYYYYYYYAAAAAAAAAAAA-=--=--+=-+=-211001ˆ{}{}{}{}TTTTJJJJnJniiiiiiJEXXEYYYYEYYEYYlll--===+-=-=-=-=邋?KL变换说明Y向量的协方差矩阵Cy非对角线元素是协方差,协方差为零,表示向量分量间的相关性甚小,X向量的协方差矩阵Cx非对角线元素非零,说明相关强。KL变换说明KL变换后能量高度集中,压缩效果明显;KL变换是在最小方差意义下最优。主要缺点:KL变换的矩阵计算复杂,该矩阵不是固定不变的,而是随着输入图像的不同而改变,没有通用的变换矩阵和快速算法正变换U=Tu反变换u=T-1u=UTu正交变换的特性2(0)(1)...(-1)()(){|[],}zzzNzjnlZzzCÎ==2()nlZ011,,...NEEE-2()nflZÎ定义是的标准正交基对于有10,NmmmffEE-==å正交变换的特性2(0)(1)...(-1)()(){|[],}zzzNzjnlZzzCÎ==2()nlZ011,,.