数字视频技术大作业(参考版)

liuxing79511
1 ℃
2020-05-30

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1.在视频图像编码系统中，运动补偿是预测编解码的基本形式之一，请阐述其基本理论及其重要性。基本理论：运动补偿就是根据求出的运动矢量，找到当前帧的像素（或像素块）是从前一帧的哪个位置移动过来的，从而得到当前帧像素（或像素块）的预测值。从原理上讲，运动补偿帧间预测编码包括以下4个部分：(1).物体划分:对于编码区域有较大运动的图像，可以将图像划分成静止区域和运动区域，运动补偿预测编码主要针对运动区域进行编码。(2).运动估计:将图像分成若干个块，并检测出当前帧中的每个块在前一帧（参考帧）图像中的对应位置，这个过程叫做运动估计。运动估计算法包括块匹配算法、基于像素的运动估计、全局运动估计和基于区域的运动估计(3).运动补偿:用运动矢量建立同一个物体在不同帧的空间位置的对应关系。(4).预测编码:对运动补偿后的物体的位移帧差信号进行DCT变换、量化、编码后与运动矢量共同经过熵编码，然后以比特流传输出去。重要性：采用运动补偿技术，这种方法经常被视频压缩/视频编解码器用来减少视频序列中的空域冗余。一个视频序列包含一定数量的图片--通常称为帧。相邻的图片通常很相似，也就是说，包含了很多冗余。使用运动补偿的目的是可以更好地利用序列图像的时间冗余度，使预测差值的方差大大减小，从而降低误码率，提高压缩比。2.视频图像压缩编码标准中采用了哪些熵编码技术？简述这些编码技术原理。熵编码是无损编码，多用可变字长编码（VLC，VariableLengthCoding）实现。其基本原理是对信源中出现概率大的符号赋予短码，对于出现概率小的符号赋予长码，从而在统计上获得较短的平均码长。可变字长编码通常有霍夫曼编码、算术编码、香农编码、游程编码等。霍夫曼编码基本原理：根据可变长最佳编码定理，即概率大的用短码，概率小的用长码，码字排列顺序严格按照概率大小排列时平均码字长度最小。香农编码基本原理：设进行可变长度最佳编码时，被编码的信息符号总数为N，所用码元进制为D，第i个符号出现的概率为Pi，与其对应码字长度为ti，则可证明这种编码结果的平均码字长度R落在下列区间内：由此可引导出对某一个信息符号(码字)的长度存在如下关系式：进一步简化为：算术编码基本原理：将输入图像看作为一个位于实数线上区间[0,1)的信息符号序列。进行概率统计，建立相应概率模型。根据每个符号出现概率将其划分为若干个子区间。各个子区间互不重叠，每个子区间有一个惟一的起始值或左端点。当对输入的符号序列编码时，依据符号出现概率来划分子区间宽度。大概率符号比小概率符号使区间变窄范围要小。符号序列越长,相应的子区间越窄，编码表示该子区间所需位数就越多,码字越长。这就是区间作为代码的原理。灰度图像游程编码基本原理：将具有相同灰度值的相邻像素所持续的行程长度和代表灰度值组合在一起作为输入的码元进行编码。游程长度编码本质上说就是计算图像信号出现行程长度，然后将行程长度转换为代码。二值图像游程编码的基本原理：把不同长度的“白游程”和“黑游程”根据其概率不同分布分别配以相应的不同长度的码字，可以得到较好的压缩。它是由行程长度编码和Huffman编码综合而成的改进型Huffman编码。3.视频压缩编码标准采用了哪些正交变换技术？变换前后，视频图像有无改变？如有，是什么变化？为什么会产生？答：采用了傅里叶正交变换（DFT）技术和离散余弦变换（DCT）技术。正交变换前后，空域中总能量和变换域中总能量保持相等不变。经过变换以后，视频图像有改变，进行了能量的重新分配，对于DFT来说，变换以后低频能量集中在中间，越靠外频率越高。对于DCT来说，变换以后低频能量集中左上角，高频能量集中在右下角，4.查找资料，请总结JPEG、H.264编码标准的算法流程。答：一JPEG编解码流程主要包括颜色转换、零偏置转换、DCT和IDCT、量化和反量化、熵编码和熵解码。（1）颜色转换人眼对亮度更敏感，提取亮度特征，将RGB转换为YCbCr模型，编码时对亮度采用特殊编码,赋予更多码速率，而对色差分量可给予较少码速率。（2）零偏置转换在DCT前，对于灰度级为2^n的像素，通过减去2^n-1,替换像素本身在IDCT后，应该加上2^n-1，替换像素本身。目的是使像素绝对值出现3位10进制概率大大减少。（3）DCTDCT正交变换后，产生64个系数，第一个系数(即F(0,0))称为直流系数(DC系数)，其余63个系数称为交流系数（AC系数）。（4）量化量化的原则是低频部分用小的值量化，高频部分用大的值量化，量化的结果将会在高频部分出现大量的0。（5）熵编码JPEG中采用的两种编码分别是霍夫曼编码和自适应二进制算术编码。二H.264编解码流程主要包括5个部分:帧间和帧内预测、变换和反变换、量化和反量化、环路滤波、熵编码。（1)帧内预测编码帧内编码用来缩减图像的空间冗余.为了提高H.264帧内编码的效率,在给定帧中充分利用相邻宏块的空间相关性,相邻的宏块通常含有相似的属性.因此,在对一给定宏块编码时,首先可以根据周围的宏块预测,然后对预测值与实际值的差值进行编码,这样,相对于直接对该帧编码而言,可以大大减小码率。（2)帧间预测编码帧间预测编码利用连续帧中的时间冗余来进行运动估计和补偿.H.264的运动补偿支持以往的视频编码标准中的大部分关键特性,而且灵活地添加了更多的功能,除了支持P帧、B帧外,H.264还支持一种新的流间传送帧——SP帧.码流中包含SP帧后,能在有类似内容但有不同码率的码流之间快速切换,同时支持随机接入和快速回放模式。（3)整数变换在变换方面,H.264使用了基于4×4像素块的类似于DCT的变换,但使用的是以整数为基础的空间变换,不存在反变换。与浮点运算相比,整数DCT变换会引起一些额外的误差,但因为DCT变换后的量化也存在量化误差。与之相比,整数DCT变换引起的量化误差影响并不大。此外,整数DCT变换还具有减少运算量和复杂度,有利于向定点DSP移植的优点。（4)量化H.264中可选32种不同的量化步长,这与H.263中有31个量化步长很相似,但是在H.264中,步长是以12.5%的复合率递进的,而不是一个固定常数。在H.264中,变换系数的读出方式也有2种:之字形(Zigzag)扫描和双扫描。大多数情况下使用简单的之字形扫描;双扫描仅用于使用较小量化级的块内,有助于提高编码效率。（5)熵编码视频编码处理的最后一步就是熵编码,在H.264中采用了2种不同的熵编码方法:通用可变长编码(UVLC)和基于文本的自适应二进制算术编码。5.以一种视频通信应用为例（如可视电话、qq视频、手机视频等），查找资料，整理并叙述其所采用的视频相关技术，如视频格式、采样格式、编码标准、编码技术细节、传输码率等。答:ITU-T制定的适用于视频会议的标准有：H.320协议（用于ISDN上的群视频会议）、H.323协议（用于局域网上的桌面视频会议）、H.324（用于电话网上的视频会议）、H.310（用于ATM和B-ISDN网络上的视频会议）和H.264（高度压缩数字视频编解码器标准）。其中H.323协议成为目前应用最广最通用的协议标准，而H.264是目前最先进的网络音视频编解码技术。接下来主要介绍的是1990年颁布的国际标准H.320。适用网络：综合业务数字网（ISDN）数据传输速率：64kbit/s~2Mbit/s视频编码协议：H.261标准码率：p*64kbps（p=1~30）编码方案：基于数字余弦变换（DCT）编码和带有运动预测的DPCM预测编码的混合方案。编码技术细节：1信源编码算法将预测误差或输入图像划分成8*8的像素块再讲4个亮度像块和两个在空间位置上与之重叠的色差像素块符合成一个16*16的宏块。然后对于帧内序列中的第一幅图像采用帧内变换编码，利用8*8的DCT实现，各DCT系数经过线性量化，变长编码进入缓冲器，根据缓冲器的上溢和下溢，来反馈调节量化器的量化步长，以控制食品编码位流使得与信道速率相匹配。帧间预测采用混合方法：利用运动补偿预测，当预测误差超过某个门限以后，对误差做DCT、视觉加权量化及熵编码。运动矢量信息编码后也送到缓冲器，DCT去除空间冗余度，而使用有运动补偿的帧间预测来去除时间上的冗余。2图像复用编码把比特流分成图像，像块组，宏块和像块，并附加相应的信息，按照CIF格式。3视频压缩算法：利用二维DCT减少图像空间域的冗余度。利用运动补偿预测减少图像的时间域冗余度。利用视觉加权量化减少“灰度域”的冗余度。利用熵编码减少图像的“频率域”的冗余度。支持的图像格式：QCIF和CIF发送和接收视频过程：捕获图像进行数字化，分析图像，编码，传输，解码，显示视频格式：典型的视频会议系统中对于人物——25/30帧/秒的CIF或SIF，内容——9帧/秒的4CIF或4SIF。同时其他标准还包括H.261，H.263，H.264，MPEG1，MPEG2和JPEG等格式子采样格式：(1)4:4:4这种采样格式不是子采样格式，它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本，这就相当于每个像素用3个样本表示。(2)4:2:2这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本，平均每个像素用2个样本表示。(3)4:1:1这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本，平均每个像素用1.5个样本表示。(4)4:2:0这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本，平均每个像素用1.5个样本表示。