1知识回顾第一章现代通信网与支撑技术概述1.1现代通信网的构成要素通信的基本概念;通信系统的组成;通信网的分层结构、组网结构、质量要求1.2现代通信网的支撑技术业务与终端技术;交换与路由技术;接入与传送技术;1.3现代通信技术的发展趋势2第二篇业务与终端技术第2章通信业务第3章通信终端本节内容3主要内容•2.1模拟与数字视音频业务•2.2数据通信业务•2.3多媒体通信业务第2章通信业务42.1模拟与数字视音频业务•在现代通信系统中尽管数据业务与多媒体通信业务发展非常迅速•但模拟与数字视、音频业务在所有通信业务中仍然占有主要地位。•在此类业务中包括普通电话、IP电话、移动电话、数字电话、可视电话、会议电视、广播电视、数字视频广播、点播电视等各种视音频业务。51:音频信息基本概念•在现代通信技术中音频信息主要是指由自然界中各种音源发出的可闻声和由计算机通过专门设备合成的语音或音乐。•按表示媒体的不同,此类声音主要有3类,即语音、音乐声和效果声等。–音频信号是随时间变化的连续媒体。–对音频信号的处理要求有比较强的时序性,即较小的延时和时延抖动。–对音频信号的处理涉及音频信号的获取、编解码、传输、语音的识别与理解、语音与音乐的合成等内容。6听觉特性与音频信号•人的听觉特性–人对声音强弱的感觉:通过对人群测试发现,当声音信号的强度按指数规律增长时,人会大体上感到声音在均匀地增强,即将声音声强取对数后,才与人对声音的强弱感相对应。根据人类听觉的这一特点,通常用声强值或声压有效值的对数来表示声音的强弱,称为声强级LI或声压级LP,单位为分贝。–人对声音频率的感觉:人对声音频率的感觉表现为音调的高低,当声音的频率按指数规律上升时,音调的感觉线性升高。这意味着只有对声音信号的频率取对数,才会与人的音高感觉成线性关系。为了适应人类听觉的音高感规律,在声学和音乐当中表示频率的坐标经常采用对数刻度。7听觉特性与音频信号–人类听觉的频响特性:•人的听觉频带为20Hz-20kHz,在此频率范围内的声音称为“可闻声”。•高于20kHz的声音称为“超声”,低于20Hz的声音称为“次声”。•不论声压级高低,人对3-5kHz频率的声音最敏感。•人类听觉的掩蔽效应:在人类听觉系统中的另一个现象是一个声音的存在会影响人们对其他声音的听觉能力,使一个声音在听觉上掩蔽了另一个声音,即所谓的“掩蔽效应”。通信、电声系统常利用该特性。8听觉特性与音频信号–音频信号特性•电话通信中每一话路的频带一般限制在300Hz~3.4kHz即可将语声信号中的大部分能量发送出去,同时保持一定的可懂度和声色的平衡。•与人的发声器官相比,各种乐器发声的频谱范围则要宽得多,从完美传送和记录音乐的角度,电声设备的频带下限一般要到16-20Hz以上。•实际声音信号的强度在一个范围内随时发生着改变,其最大声强与最小声之差称为声音信号的动态范围,用分贝表示。•一般语音信号约有20-40dB,交响乐、戏剧等声音信号的动态范围60-80dB,甚至超过100dB。92:视频信息•视频信息即活动或运动的图像信息,它由一系列周期呈现的画面所组成,每幅画面称为一帧,帧是构成视频信息的最基本单元。视频信息在现代通信系统所传输的信息中占有重要的地位,因为人类接受的信息约有70%来自视觉,所以视频信息具有准确、直观、具体生动、高效、应用广泛、信息容量大等特点。10视频技术基础•视频技术是利用光电和电光转换原理,将光学图像转换为电信号进行记录或远距离传输,然后还原为光图像的一门技术。–视频信号与图像扫描:视频技术中实现光学图像到视频图像信号转换的过程通常是在摄像机中完成的。–彩色电视系统:按照三基色的原理设计和工作的。在彩色电视中由三种基色R,G,B构成亮度信号Y的比例关系:Y=0.299R+0587G+0.114B电视系统的亮度方程11视频技术基础.至于二个色差信号,则是分别传送红基色分量和蓝基色分量与亮度分量的差值信号,即U和V12()()UKBYVKRY12视频信号频谱特点•电视系统是通过行、场扫描来完成图像的分解与合成的.尽管图像内容是随机的,但视频信号仍具有行、场或帧的准周期特性。通过对静止图像电视信号进行频谱分析。可它是由行频、场频的基波及其各次谐波组成的,其能量以帧频为间隔对称地分布在行频各次谐波的两侧。而对活动图像的电视信号,其频谱分布为以行频及其个次谐波为中心的一簇簇连续的梳状谱。•对于实际的视频信号,谐波的次数越高,其相对于的基波振幅的衰减越大。•在整个视频信号的频带中,没有能量的区域远大于有能量的区域。根据这一性质,模拟彩色电视系统利用频谱交错原理将亮度信号和色差信号进行半行频或1/4行频间置,完成彩色电视中亮度信号和色度信号的同频带传输。13视音频信息数字化•视音频信息数字化–音频信息时间上的离散化和图像信息空间位置的离散化;–音频信息电平值和图像灰度电平值的离散化。14视音频压缩编码信源存储量电话(200~3400Hz)8000样本数/秒x12比特/样本=96kbps宽带语音(50~7000Hz)16000样本数/秒x14比特/样本=224kbps宽带音频(20~20000Hz)44100样本数/秒x2通道x16比特/样本=1.412Mbps图像512x512像素彩色图像x24比特/像素=6.3兆比特/图像视频640x480像素彩色图像x24比特/像素x30图像/秒=221Mbps高清晰度电视1280x720像素色彩图像x60图像/秒x24比特/像素=1.3Gbps未压缩信源的大致比特率15数据的冗余性•数据之所以能够压缩是基本原始信源的数据存在着很大的冗余度。数据中存在以下种类的数据冗余。•空间冗余–这是图像数据中经常存在的一种冗余。在同一幅图像中,规则物体和规则背景(所谓规则是指表面颜色分布是有序的而不是完全杂乱无章的)的表面物理特征具有相关性,这些相关性的光成像结构在数字化图像中就表现为数据冗余。•时间冗余–这是序列图像(电视图像、动画)和言语数据中所经常包含的冗余。图像序列中的两幅相邻的图像,后一幅图像与前一幅图像之间有较大的相关性,这反映为时间冗余。同理,在言语中,由于人在说话时发音的音频是一连续的渐变过程,而不是一个完全在时间上独立的过程,因而存在时间冗余。•信息熵冗余16数据的冗余性•知识冗余–有许多图像的理解与某些基础知识有相当大的相关性。例如,人脸的图像有固定的结构,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正面图像的中线上等等。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。•认知(视觉听觉)冗余–人类视觉系统对于图像场的任何变化,并不是都能感知的。例如,对于图像的编码和解码处理时,由于压缩或量化截断引入了噪声而使图像发生了一些变化,如果这些变化不能为视觉所感知,则仍认为图像足够好。事实上人类视觉系统一般的分辨能力约为26灰度等级,而一般图像量化采用28灰度等级,这类冗余我们称为视觉冗余。对于听觉,也存在类似的冗余。17数据的冗余性•结构冗余–有些图像从大的区域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。•其他冗余–例如由图像的空间非定常特性所带来的冗余。–数据压缩就是去掉信号数据的冗余性。数据压缩常常又称为数据信源编码,或简称为数据编码。与此对应,数据压缩的逆过程称为数据解压缩,也称为数据信源解码,或简称为数据解码。18常用压缩编码方法分类19视频压缩编码长期以来,为了更好地传输图像信号,图像压缩编码技术一直在不断地发展。到目前为止,已经发展了第一代基于像素的图像编码技术、第二代基于图像内容及人类视觉系统特征的图像编码技术。20视频压缩编码•第一代图象编码技术的实现相对简单,其编码实体是像素或像素块(8*8或16*16),它们具有以下的共同特点:–把图像分解成一些事先确定的固定大小的像素块,其块的划分方法与图像内容无关;–接收端获得的图像中每一像素,与原始图像中相对应的像素是相似的;–利用运动补偿技术减小时间冗余度,但不考虑图像内容的结构,几乎不考虑人眼的视觉特性。••目前,采用这类编码方法的主要技术有:–无失真压缩编码:哈夫曼编码、算术编码、游程编码等。–有失真压缩编码:预测编码:DPCM、运动补偿;频率域方法:正交变换编码(DCT),子带编码;空间域方法:统计分块法;基于重要性:滤波、子抽样、比特分配、矢量量化。21视频压缩编码•随着编码技术研究的逐步深入,人们发现第一代方法用于极低比特率的视频编码时有着较严重的局限性,几乎已达到压缩的饱和状态。•1985年,正式提出第二代图像编码技术。•第一代编码方法的着重点在于“如何给一个基于一定分割方式得到的图像消息序列分配合适的码字”。•第二代图像方法的着重点则在于“按照怎样的方式获得图像消息序列”,也就是说在第二代图像编码方法中,按图像的内容分割图像生成消息序列,同时还结合了人眼的视觉特性。•第二代编码方法主要有:模型基图像序列编码;分析图像序列编码基;小波变换编码。22无失真压缩编码•Huffman编码–将符号按出现的概率排序,概率大的在后,概率小的在前。给最后的两个符号各赋予一个二进码,概率大的赋1,概率小的赋0(反之也可)。–把最后两个符号的概率加起来合成一个概率,再按大小重新排序。重新排序后重复步骤一的编码过程。–重复第二步,直到最后只剩下两个概率为止。–将每个符号所对应的各分支赋予的0,1值反向逆序排出,即得到各符号的编码。23无失真压缩编码Huffman示意图码长2233344码字111001101000100010000符号a1a2a3a4a5a6a7概率0.20.190.180.170.150.100.0101000101101124无失真压缩编码•算术编码–算术编码是另一种利用信源概率分布特性、能够趋近熵极限的编码方法。–它也是对出现概率大的符号采用短码,对出现概率小的符号采用长码。–算术码与Huffman码不同,对各符号的编码输出并不是固定的整数码。–在信源概率分布比较均匀的情况下,其编码效率高于Huffman编码25无失真压缩编码•算术编码–算术编码的基本原理是将编码的消息表示成实数0和1之间的一个间隔(Interval),消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。–算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。26无失真压缩编码•给定事件序列的算术编码步骤如下:–编码器在开始时将“当前间隔”[L,H)设置为[0,1)。–对每一事件,编码器按步骤(a)和(b)进行处理(a)编码器将“当前间隔”分为子间隔,每一个事件一个。(b)一个子间隔的大小与下一个将出现的事件的概率成比例,编码器选择子间隔对应于下一个确切发生的事件相对应,并使它成为新的“当前间隔”。–最后输出的“当前间隔”的下边界就是该给定事件序列的算术编码27无失真压缩编码假设信源符号为{A,B,C,D},这些符号的概率分别为{0.1,0.4,0.2,0.3}–根据这些概率可把间隔[0,1]分成4个子间隔:[0,0.1],[0.1,0.5],[0.5,0.7],[0.7,1],其中[x,y]表示半开放间隔,即包含x不包含y。上面的信息可综合在下表中符号ABCD概率0.10.40.20.3初始编码间隔[0,0.1)[0.1,0.5)[0.5,0.7)[0.7,1)28无失真压缩编码•如果二进制消息序列的输入为:CADACDB。–编码时首先输入的符号是C,找到它的编码范围是[0.5,0.7]。–由于消息中第二个符号A的编码范围是[0,0.1],因此它的间隔就取[0.5,0.7]的第一个十分之一作为新间隔[0.5,0.52]。–依此类推,编码第3个符号D时取新间隔为[0.514,0.52],–编码第4个符号A时,取新间隔为[0.514,0.5146]–消息的编码输出可以是最后一个间隔中的任意数29无失真压缩编码