数字电视中信号的处理摘要:数字电视的信号从发送、传输到接收的全过程都为数字化。本文简单的介绍了A/D转化,数据压缩,MPGE—2的视频音频的压缩标准。以及信号调制的过程。关键字:A/D转化数据压缩MPGE—2信号调制数字电视是指电视的图像和音频用数字化信号发送。所以准确定义的数字电视除了指我们平时所说的数字电视接收机外,还包含了从发送、传输到接收的全过程。由电视台送出的图像及声音信号,经数字压缩和数字调制后,形成数字电视信号,经过无线介质或有线介质传送到数字电视接收机,然后通过数字解调和数字视音频解码处理还原出图像及伴音。一、将模拟信号转换为数字信号将连续的模拟信号转变成数字信号是数字电视信号采集的必要步骤。在实际工作中,信号的取样是通过A/D转换芯片来完成的。通过A/D转换,将模拟信号x(t)变成数字信号x(nTs),电视信号的A/D转换一般采用脉码调制方式。为了保证数字化后的信号数据不丧失原信号的特性,采样频率应大于或至少等于信号截止频率的2倍。这就是著名的奈奎斯特(Nyquist)采样定理对于二维图像信号,必须保证水平采样频率和垂直采样频率应分别大于图像在水平和在垂直方向上最高频率的2倍。而对于音频信号,采用的频率应大于音频信号的最大频率的2倍。一般质量音频信号的最高频率被限制在15kHz,所以目前有四种不同的采样频率:48kHz;44.1kHz;44.056kHz;32kHz。采样结束后对采样信号进行量化使得幅度连续的抽样值进一步在幅度上离散化。便于利用有限长的数码来表示每个抽样点的幅度。量化所产生的误差会影响信号的质量,分析时,一般将它等效于随机杂波,称为量化噪波。当量化的位数n越大,量化的信噪比就越大,再生的图片质量就越高。对于音频信号的量化过程中所产生的噪声,为了使量化噪声转变为与输入不相关的白噪声,就要在输入的音频信号上加上一称为高频脉动信号的噪声再进行量化。接下来对样点幅度的量化值进行编码,将其转变为成二进制的数码。经抽样,量化,编码所得到的数字信号极为PCM信号。(一)图像编码数字电视中对于图像的处理是一个比较复杂的过程。数字电视是在模拟电视的基础上发展起来的,数字电视设备要和模拟电视设备长期共存,因此,在选择电视信号数字化参数时要考虑到数字电视设备的兼容性问题,使现存的模拟电视制式和数字电视能有最大程度的共同性。电视信号的数字化处理有数字复合编码和数字分量编码两种方式。数字复合编码是将复合彩色全电视信号直接进行数字化。复合编码的优点是码率低些,设备较简单,适用于在模拟系统中插入单个数字设备的情况。采用复合编码时由抽样频率和副载频间的差拍造成的干扰将影响图像的质量。它的缺点是由于数字电视的抽样频率必须与彩色副载频保持一前置滤波器(fc=fs/2)取样器量化器编码器f(t)f(n)模拟信号定的关系,而且各种制式的副载频各不相同,难以统一。分量编码是将三基色信号R、G、B分量或亮度和色差信号Y、(B-Y)、(R-Y)分别编码形成数字化信号分量编码的优点是编码与制式无关,只要抽样频率与行频有一定的关系,便于制式转换和统一。由于Y、(R-Y)、(B-Y)分别编码,可采用时分复用方式,避免亮色互串,可获得高质量的图像。在分量编码中,亮度信号用较高的码率传送,两个色差信号的码率可低一些,但总的码率比较高,设备价格相应较贵。图像的采样结构是指采样点在空间和时间上的相对位置。采样结构有正交结构和行交叉结构等几种,在数字电视图像采样中一般使用正交结构,以有利于帧内和帧间信号处理。为保证采样结构为正交,要求行周期必须是采样周期的整数倍。图像亮度信号的采样应满足采样定理的要求,取样频率应大于视频带宽的2倍。为保证采样结构正交,采样频率应是行频的整数倍。为方便节目交流,亮度信号采样频率应兼顾NTSC制和PAL制,即应是这两种制式行频的最小公倍数的整数倍。为降低码率,采样频率的选择应尽量小。根据大面积着色原理,色度信号的带宽可以比亮度信号窄,同时考虑正交结构的要求,在数字电视中经常使用以下几种亮色采样格式:4:2:2格式;4:4:4格式;4:2:0格式;4:1:1格式。在4:2:2格式中,色差信号Cr和Cb的采样频率均为亮度信号采样频率的一半,即:fCr=fCb=(1/2)fy=6.75MHz。也就是亮度采样频率和两个色差信号的采样频率之比为:fy:fCr:fCb=4:2:2色差信号在水平方向上的采样点数为亮度信号的一半,在垂直方向上的采样点数与亮度信号相同。这种格式主要用于标准清晰度数字电视(SDTV)演播室中。在4:4:4格式中,色差信号Cr和Cb的采样频率与亮度信号采样频率相同,即:fCr=fCb=fy=13.5MHz。也就是亮度采样频率和两个色差信号的采样频率之比为:fy:fCr:fCb=4:4:4。这种格式主要用于要求高质量的信号源的情况下,比如科学研究等。而4:2:0格式侧重于传输链末端分配应用,MPEG-2中使用的就是这种方式。4:1:1则应用于新闻、体育等对质量要求不高的记录环境。(二)音频编码香农定理指出:如果信号的平均信息量小于所用传输通路的传输容量,则存在着正确的编码方式。所以要有效的利用传输通路,必须对知道传输通道的传输容量,以及信号的信息量,找出最佳的编码方式。1、利用冗余度节约传输通路(1)预测编码它是从过去的采样值预测现在的才样值,并将真正的取样值与预测值之差进行编码传输的编码。(2)熵编码在数字化的信号中,小电平比大电平出现的机会要多。因此可以像莫尔斯电报码一样,对于出现概率较大的电平,采用短码,而概率较小的电平采用长码,从而进一步节约比特率。2、利用数据压缩技术节约传输容量(1)瞬时压扩与准瞬时压扩利用人耳的听觉特性,在输入时将较宽的幅度范围进行压缩,而在输出的时候再进行扩张。压扩操作可以在A/D转换或者数字阶段进行。(2)自适应PCM是一种根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以使音节自适应,即量化阶的大小在较长时间周期里发生变化。(3)自差分PCM它结合了ADM的差分信号与PCM的二进制码的方法,是一种性能比较好的波形编码。它的核心想法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。二、数字信号的压缩电视信号数字化后的数据量过大,使普通的存储器难以接受。而且,数码率太高使数字电视信号频带过宽,频道利用率太低,甚至无法容纳整个信号的传输。分量编码:4:2:2标准:R=165.9Mb/s频带宽度B≈83MHz;4:4:4标准:R=278.7Mb/s频带宽度B≈140MHz;4次群的R为139.264Mb/s,可传话路1920路。1920路电话传不了一套4:2:2的数字电视节目;用11套模拟电视节目换一套数字电视节目。号频带太宽,频带利用率低,频率资源严重浪费。同时对电路要求高,设计复杂,维修困难,设备造价高。所以对数字信号进行压缩显得很有必要。由于图像本身存在大量的冗余:空间相关冗余时间相关冗余;符号相关冗余;结构相关冗余;知识相关冗余。以及人类的视觉冗余,所以对于图像信号的压缩时可行的。压缩的途径及方法:行、场逆程不传送,在接收端重新形成;亚奈奎斯特取样法,使得采样频率fs<2fm,使混叠分量与亮度谱线交错;采用高效率的编码――信源编码,去除电视信号中的冗余。(一)图像压缩1、预测编码利用某种数学模式对以前已知的相关数据进行运算,得出一个与当前传送样值相接近的预测值,进而把当前要传送的值减去预测值,得到一个误差值――预测误差,将这个误差值编码后传送出去。当前样值-预测值=预测误差预测编码去除了电视信号中空间、时间上的冗余。给出了良好的概率分布,为后面的压缩编码创造了条件。一维预测:参考样值仅与xN当前样值处于同一扫描行内的预测编码;二维预测:参考样值除了本行之外还和前一行或前几行的样值有关;三维预测:参考样值除了本帧之外还和前一帧或前几帧图像的样值有关。由于一、二维预测都是在同一帧内进行预测,所以也称为帧内预测编码;三维预测与前面的帧有关,所以也称为帧间预测编码。2、变换编码变换编码中经常使用的是离散余弦变换——DCT变换。DCT变换是把空间域上的信号变换到频率域上,使能量在空间域上分散分布的原信号变换后能量在频率域上相对集中到某些少数区域内,即将空间域上的信号样值变换成频率域上的系数,经变换后的系数按频率由低到高分布。DCT变换的处理步骤:⑴将一幅图象分成若干像块,每个像块的大小为8×8个像素。⑵对每一块像块进行DCT变换。⑶对变换后的系数进行量化。⑷进行之字形扫描(读出)和零游程编码像块样值数据f(x,y)为8×8的矩阵,经DCT后的频域系数F(u,v)也为8×8的矩阵。此矩阵的左上角系数F00相当于像块中64个样值的平均直流成分,其余的63个F(u,v)均表示64个样值中所含交流成分的系数。经过变换后,较大的系数集中在直流分量及附近的低频区域,即信号能量主要集中在直流及低频区域的少数变换系数上,高频区域的系数多为0或很小。3、统计编码(熵编码)统计编码是基于信号统计特性的编码技术。它的基本原理是按信源符号出现概率的不同分配以不同长度的码字(bit数),概率大的分配以短的码字,概率小的分配以长的码字。这样使最终的平均码长很小,总的数码率大大降低。经常使用的是霍夫曼编码。基本的步骤如下:①将每个符号按其概率由大到小顺序排列起来。②将最小的两个概率相加,并对其中较大的概率用“1”表示,较小的概率用NvyNuxyxfvCuCNvuFxy2)12(cos2)12(cos),()()(2),(707077002(21)(21)(,)()()(,)coscos22uvxuyvfxyCuCvFuvNNN“0”表示。反之也可,但赋值方式应保持一致。③把求出的和值作为一个新的概率值再按①重新排列。④按照这样的步骤重复进行,直到概率加到1。⑤分配码字。由概率为1处开始沿各点参加运算的分支线从后向前(从右向左)逐一写出“0”、“1”的代号(从高位到低位写)直到各符号为止。得到的代码就是各信源符号的码字。反之也可,从符号到汇合点p=1(从左到右),但代码的写出是从低位到高位。(二)音频压缩声音信号客观统计规律。人耳听觉的生理、心理学因素根据声学理论,人耳存在着一个听觉的阈值,当某个频率的声音的强度(声强)小于某个特定的数值之后,人耳就听不见了,即当声音弱到人的耳朵刚刚可以听见时,我们称此时的声音强度为“听阈”。在编码时,可以根据人耳的特性进行编码,减少冗余。可将时间上彼此相继的取样值归并成块;由掩蔽效应,人耳听不到的不传;对于人耳不能分辨方向的频率接近的高频音,不必再分声道,将多声道的高频音耦合到一个公共通道;采用子频带编码,由每个子频带中的最小同听阈来确定各子频带取样值的必要的量化。声音压缩主要有两种编码方法:1、MUSICAM编码MUSICAM----掩蔽型自适应通用子频带集成编码与复用。这种编码的方法属于子频带编码,它是用滤波器组将宽频带的声音信号的频谱分割为宽度均为750Hz的32个子频带。每个子带的量化和比特分配是利用人耳听觉的心理声学模型和音频信号统计特性的内在联系确定,并清除音频信号中的冗余和不相干部分,来实现有效的数据压缩。Layer1——简单版本。在CD质量下,比特率为384Kb/s,压缩比为1:4。主要用于数字盒式录音磁带、VCD。Layer2——标准版本,编码器的复杂度属中等。CD质量下,比特率为192Kb/s左右,压缩比为1:8。在数字演播室、DAB、DVB、电缆和卫星广播ADR、计算机多媒体等数字节目的制作、交换、存储、传送中得到广泛应用。Layer3——复杂版本。它是MUSICAM和ASPEC(自适应(声频)频谱感知熵编码)的混合编码。声音质