1.数字电视广播系统的构成答图1-1是数字电视广播系统方框图。该系统由信源编码、多路复用、信道编码、调制、信道和接收机等六部分组成。2.数字电视与电视数字化处理的区别p2现在的模拟彩色电视接收机的电路中采用了多种数字化处理技术,往往自称为数码电视或数字化电视。这些彩色电视机在不改变现行模拟广播电视传输体制的前提下,对解调后的视频和音频的基带信号进行了数字化处理,获得了更高质量的图像和伴音,增加了电视机的功能,但它仍属于模拟电视的范畴,只能接收模拟电视信号,无法接收数字电视信号,与真正的数字电视是两个不同的概念,不可混淆。这些数字化处理技术包括:用数字梳状滤波器进行较完善的亮度、色度分离,消除了亮、色窜扰现象;对亮度信号进行数字轮廓增强,提高了画面清晰度;对色度信号进行数字降噪和色调校正,减少了画面噪点和色调畸变;用逐行扫描及倍场(DoubleScan)消除行间闪烁和大面积闪烁,提高了图像的垂直清晰度;处理后还能实现画中画、静止画面等新功能以及丽音NICAM(NearInstantaneousCompandingAudioMultiplex,准瞬时压扩音频多路传输,是一种数字脉冲编码调制立体声广播系统,用7.28MHz频率广播)和环绕立体声等功能。3.SDTV和HDTVp3标准清晰度电视SDTV(StandardDefinitionTelevision)是指质量相当于目前模拟彩色电视系统(PAL、NTSC、SECAM)的数字电视系统,也称为常规电视系统。其定义是,ITU-R601标准的4∶2∶2的视频,经过某些数据压缩处理后所能达到的图像质量。其清晰度约为500电视线,视频数码率约为5Mb/s。高清晰度电视HDTV(HighDefinitionTelevision)是指水平清晰度和垂直清晰度大约为目前模拟彩色电视系统的两倍,宽高比为16∶9的数字电视系统。根据ITU的定义,一个具有正常视觉的观众在距离高清晰度电视机大约是显示屏高度3倍的地方所看到的图像质量应与观看原景象或表演时所得到的印象相同。其清晰度应在800电视线以上,视频数码率约为20Mb/s。4.与模拟电视相比,数字电视的优点表现在以下几个方面。P41.图像传输质量较高2.具有数字环绕立体声伴音3.频谱资源利用率高4.多信息、多功能5.设备可靠,维护简单6.节省发送功率,覆盖范围广7.易于实现条件接收5.数码率和传码率p4数码率,也称比特率或者传信率,是指单位时间内传送的二进制比特数,记为Rb,单位为比特/秒,用符号b/s表示。经常还以兆比特/秒和吉比特/秒为单位,即用符号Mb/s和Gb/s表示。传码率是码元(symbol)的传输速率,是指单位时间内传输码元的数目,记为RB,单位为波特(baud)。为明确起见,在给出传码率的同时,应说明码元的进制M,或者说明码元的二进制位数m,这里M=2m。Rb=RB·lbM=RB·m(b/s)6.误码率和误码秒p5误码率也叫码元差错率,是指信号传输过程中系统出现错误码元的数目与所传输码元总数之比值误比特率也称信息差错率或比特差错率,是指传错信息的比特数与所传输的总信息比特数之比值误码秒是指一段时间之内发生误码的秒数(erroredsecondsoveraperiodoftime)7.频带利用率和功率利用率p6频带利用率是衡量数字传输系统有效性的一个重要指标。它表示在单位时间、单位频带内传输信息的多少,即单位频带内所能实现的数码率,单位为比特/秒赫兹,用符号b/(s·Hz)表示。功率利用率是指在一定误码率的条件下,传输每比特信息所需要的最小信号平均功率。功率利用率越高,误码率越小,信息传输的可靠性就越高。8.信道容量p6香农(Shannon)研究了受随机噪声干扰的信道情况,得出了计算信道容量的香农公式:9.编码效率p71)平均信息量2)平均码字长度3)编码效率音频视频辅助数据控制数据信源编码视频压缩音频压缩多路复用信道编码调制信道接收机传错码元总数传错码元个eP传输的总信息比特数传错信息比特数bP)b/s(1b1NSBC)(b11比特iniiPPHniiiNPN1NH只要使N≥H,就可以得到某种无失真编码方法。但如果NH,则表明这种编码方法效率太低,占用的比特数太多。最好的编码结果是N≈H,即η=1。这种状态的编码称为最佳编码,它不会因丢失信息而引起图像失真,又占用最少的比特数。如果编码结果为NH,则必然会丢失信息而引起图像失真,这就是在允许失真条件下的一些失真编码方法。第二章1视频信号压缩的可能性p11视频数据主要存在以下形式的冗余。1.空间冗余2.时间冗余3.结构冗余4.知识冗余5.视觉冗余(a)A/D变换;(b)D/A变换图2-1电视信号的数字化和复原2视频信号的数字化p12AD前面有一低通滤波器用于抗混叠,解码的滤波器为重构滤波器,解码是编码的逆过程,插入滤波是把解码后的信号用理想低通滤波恢复为平滑、连续的模拟信号。3.ITU-RBT.601分量数字系统p13BT.601建议采用对亮度信号和两个色差信号分别编码的分量编码方式,对不同制式的信号均采用相同的取样频率,对亮度信号Y采用的取样频率为13.5MHz。由于色度信号的带宽远比亮度信号的带宽窄,因此对色度信号U和V的取样频率为6.75MHz。色度信号的取样率是亮度信号的取样率的一半,常称作4∶2∶2格式,可以理解为每一行里的Y、U、V的样点数之比为4∶2∶2。4.Huffman编码p14(1)将输入信号符号以出现概率由大至小为序排成一列。(2)将两处最小概率的符号相加合成为一个新概率,再按出现概率大小排序。(3)重复步骤(2),直至最终只剩两个概率。(4)编码从最后一步出发逐步向前进行,概率大的符号赋予“0”码,另一个概率赋予“1”码,直至到达最初的概率排列为止。平均码长为0.4×1+0.3×2+0.1×3+0.1×4+0.06×5+0.04×5=2.2位游程编码RLC(RunLengthCoding)是一种十分简单的压缩方法,它将数据流中连续出现的字符用单一的记号来表示。游程编码的压缩率不高,但编码、解码的速度快,因而仍得到了广泛的应用,特别是在变换编码及进行Z字形(zigzag)扫描后,再进行游程编码,会有很好的效果。5.预测编码p16基于图像的统计特性进行数据压缩的基本方法就是预测编码。它利用图像信号的空间或时间相关性,用已传输的像素对当前的像素进行预测,然后对预测值与真实值的差——预测误差进行编码处理和传输。目前用得较多的是线性预测方法,其全称为差值脉冲编码调制DPCM(DifferentialPulseCodeModulation)。利用帧内相关性(像素间、行间的相关)的DPCM被称为帧内预测编码。如果对亮度信号和两个色差信号分别进行DPCM编码,即对亮度信号采用较高的取样率和较多位数编码,对色差信号用较低的取样率和较少位数编码,那么构成时分复合信号后再进行DPCM编码,数码率可以更低。6.离散余弦变换(DCT)p19在常用的正交变换中,离散余弦变换DCT(DiscreteCosineTransform)的性能接近最佳,是一种准最佳变换。DCT矩阵与图像内容无关,由于它构造成对称的数据序列,因而避免了子图像轮廓处的跳跃和不连续现象。DCT也有快速算法FDCT,在图像编码的应用中,大都采用二维DCT。量化PCM信号模拟电视信号取样脉冲PCM信号模拟电视信号取样编码解码插入滤波(a)(b)输入电平L1L2L3L4L5L6概率0.40.30.10.10.060.040.40.30.10.10.10.40.30.20.10.40.30.30.60.4编码10001101000101001011“0”“1”“0”“1”“0”“1”“0”“1”“0”“1”图2-9游程编码(a)Z字形扫描;(b)交替扫描7.JPEG标准p21联合图片专家小组(JointPhotographicExpertsGroup)的缩写1991年3月,JPEG建议(ISO/IEC10918号标准)——“多灰度静止图像的数字压缩编码(通常简称为JPEG标准)”正式通过,这是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准,包括无损压缩及基于离散余弦变换和Huffman编码的有损压缩两个部分。(1)彩色坐标转换。彩色坐标转换是要去除数据冗余量,它不属于JPEG算法,因为JPEG是独立于彩色坐标的。压缩可采用不同坐标(如RGB、YUV、YIQ等)的图像数据。(2)离散余弦变换。JPEG采用的是8×8子块的二维离散余弦变换算法。在编码器的输入端,把原始图像(U、V的像素是Y的一半)顺序地分割成一系列8×8的子块。在8×8图像块中,像素值变化缓慢,具有较低的空间频率。进行二维8×8离散余弦变换可以将图像块的能量集中在极少数系数上。DCT的(0,0)元素是块的平均值,其它元素表明在每个空间频率下的谱能为多少。一般地,离原点(0,0)越远,元素衰减得越快。(3)量化。为了达到压缩数据的目的,对DCT系数需作量化处理。量化的作用是在保持一定质量的前提下,丢弃图像中对视觉效果影响不大的信息。量化是多对一映射,是造成DCT编码信息损失的根源。(4)直流分量差分编码。64个变换数经量化后,DCT的(0,0)元素是直流分量(DC系数),即空间域中64个图像采样值的均值。相邻8×8子块之间的DC系数一般有很强的相关性,变化应该较缓慢。JPEG标准对DC系数采用DPCM编码(差分编码)方法,即对相邻像素块之间的DC系数的差值进行编码,这样能将它们中的大多数数值减小。(5)交流分量游程编码。其余63个交流分量(AC系数)采用游程编码。如果从左到右、从上到下地扫描块,则零元素不集中,因此采用从左上角开始沿对角线方向的Z字形扫描。量化后的AC系数通常会有许多零值。(6)熵编码。为了进一步压缩数据,需对DC和AC的码字再作统计特性的熵编码。JPEG标准推荐采用Huffman编码,并给出差分编码和游程编码变换为Huffman编码的码表。P22~25?8.帧间预测编码p26帧间预测将画面分为以下3种区域:(1)背景区。相邻的帧背景区的绝大部分数据相同,帧间相关性很强。(2)运动物体区。若将物体运动近似看作简单的平移,则相邻帧的运动区的数据也基本相同。假如能采用某种位移估值方法对位移量进行“运动补偿”,那么两帧的运动区之间的相关性也是很强的。(3)暴露区。暴露区是指物体运动后所暴露出的曾被物体遮盖住的区域。如果存储器将暴露区的数据暂存,则遮盖后暴露出来的数据与存储的数据相同。若是画面从一个场景切换为另一场景,就没有帧间相关性了。1)空间分辨率和时间分辨率的交换人眼对静止图像的分辨力较高,因而在传输静止图像或图像的静止部分时要有较高的分辨率,但可以减少传输的帧数,而在接收端依靠帧存储器把未传输的帧复制出来。人眼对于图像中运动物体的分辨率随着物体运动速率的增大而降低,摄像器件和显示器件也有一定的积分模糊效应,因而在传输图像中的运动物体时可以降低这部分图像的分辨率。物体的运动速度越高,可用越低的分辨率进行传输,这种方法就叫做空间分辨率和时间分辨率的交换。2)帧内、帧间自适应编码对于变化缓慢的图像,帧间相关性强,宜采用帧间预测;当景物的运动增大时,帧间相关性减弱,而由于摄像机的“积分效应”,图像的高频成分减弱,帧内相关性反而有所增加,应采用帧内编码。因此,编码器应进行帧内、uv0123456701234567(a)(b)RGBYUV彩色坐标转换DCT量化DPCM游程编码熵编码帧间自适应编码。3)运动补偿预测编码对于运动的物体,估计出物体在相邻帧内的相对位移,用上一帧中物体的图像对这一帧的物体进行预测,将预测的差值部分编码传输,就可以压缩这部分图像的码率。这种考虑了对应区域的位移或运动的预测方式就称为运动补偿预测编码。帧间预测是运动补偿预测在运动矢量为零时的特殊情况。运动补偿帧间预测编码包括以下4个部分:(1)物体的划分:划分静止区域和运动区域。(2)运动估计:对每一个运动物体进行位移