现代通信技术基础(蒋青主编)第8章.

ebgames
2 ℃
2019-12-21

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第八章多媒体通信技术8.1多媒体通信概述8.2多媒体音频技术8.3多媒体图像视频技术8.4多媒体通信系统8.5IP多媒体子系统8.1多媒体通信概述8.1.1媒体和多媒体的基本概念国际电信联盟ITU-T把媒体分成5大类（1）感觉媒体作用人的感觉器官，直接产生感觉的一类媒体。如各种语言、音乐、自然界的各种音乐等。（2）表示媒体为了有效传输、存储、加工和处理感觉媒体而人为研究、构造出的一种媒体。如文本编码、语言编码、图像和视频编码等。（3）表现媒体是感觉媒体和通信中的电信号之间进行转换的一种媒体。分为输入表现媒体和输出表现媒体两种。（4）存储媒体存储表示媒体的物理介质。如：纸张、磁盘、光盘等。（5）传输媒体将媒体从一处传送到另一处的物理载体。如同轴电缆、双绞线、光纤、自由空间等。根据上述分类，可从两个层面来理解媒体：一是媒体是存储和传递信息的物理载体；另一个是媒体是信息的表现形式，如文字、声音、图像、视频等。8.1.2多媒体信息的主要类型1、文本是用文字和各种专用符号表达信息的一种形式。主要用于对知识的描述性表示，如阐述概念、定义、原理和问题以及显示标题、菜单等内容。2、图像是记录在介质上的客观景物的映像，如照片、电影、电视等。图像是多媒体中最重要的信息表现形式之一。3、动画利用人的视觉暂留特性，快速播放一系列连续运动变化的图形图像，包括画面的缩放、旋转、变换、淡入淡出等特殊效果。动画用于教学中，可以把抽象的内容形象化，使许多难以理解的教学内容变得生动有趣。4、声音是人们用来传递信息、交流感情最方便、最熟悉的方式之一。在多媒体技术中，按其表达形式，可将声音分为讲解、音乐、效果三类。5、视频影像视频影像具有时序性与丰富的信息内涵，常用于交待事物的发展过程。视频非常类似于我们熟知的电影和电视，有声有色，在多媒体中充当起重要的角色。8.1.3多媒体通信及其主要特征1、集成性多媒体信息的集成和处理这些媒体的设备与设施的集成。2、交互性是指在通信系统中人与系统之间的相互控制能力。有两个方面的内容。其一是人机接口，其二是用户终端与系统之间的应用层通信协议。3、同步性是指多媒体通信终端上显示的图像、声音和文字必须以同步方式工作。多媒体通信系统中通过网络传送的多媒体信息必须保持其时间对应关系，即同步关系。8.1.3多媒体通信业务类型1、交互型业务在用户之间或用户与主机之间提供双向信息交换的业务，又可分为：（1）会话型业务以实时端到端的信息传送方式提供用户之间或用户与主机之间的双向通信。如：电话、会议电视、Internet接入、数据通信以及交互式视频娱乐。（2）消息型业务通过具有存储转发和消息处理功能的存储单元，提供用户对用户的非实时通信。如电子信箱、语音信箱、视频邮件、文件传递等。（3）检索型业务用户能够检索存储在信息中心的信息。该信息只在用户需要时才送至用户，信息能够单个地受到检索，而且，信息序列开始的时间是由用户控制的。如：宽带可视图文、图像检索业务、文件检索业务、数据检索业务。2、分配型业务是由网络的一个给定点向其它多个位置传送单向信息流的业务。又分为不由用户控制的分配型业务和由用户控制的分配型业务。（1）不由用户控制的分配型业务该类业务是一种广播业务，提供连续的信息流，并把这些信息流从中心源分配至网络中有权接收的用户，用户不能控制广播信息的起始时间和顺序。包括：常规电视分配型业务、数字电视分配型业务、音乐节目分配型业务等。（2）用户控制的分配型业务该类业务为点播型的，这类业务也是将信息流从中心源分配至用户，但用户可以控制节目的起停和顺序。这类业务包括：全频道广播视频通信，可用于远程教学，新闻检索和节目点播等。8.1.4多媒体通信的应用多媒体通信已经开始走进家庭和学校，多媒体技术已经应用到教育、科研、商业、医疗、企事业单位等许多领域。1、多媒体走进家庭2、多媒体走进学校（1）交互式学习（2）虚拟实验室和虚拟图书馆3、多媒体技术在商业和企事业单位的应用4、多媒体技术在医疗领域的应用5、多媒体技术在出版社的应用8.2.1声音信号及数字化声音是携带信息的重要媒体，是多媒体技术研究的主要内容。声音信号由许多不同频率和幅度的分量信号组成的。亚音信号：频率小于20Hz的信号；音频信号：频率范围为20Hz～20kHz信号；话音信号：频率范围为300～3400Hz声音信号；超音频信号：高于20kHz的信号。8.2多媒体音频技术在多媒体技术中，处理的信号主要是音频信号，包括音乐、话音、效果声等。话音信号是模拟信号，如图8.1所示。音频信号数字化的处理通过：采样、量化和编码三个过程，可以把模拟的音频信号转换成数字音频信号。在多媒体技术中，对音频信号的质量要求比较高，通常选用的采样频率为：11.025kHz、22.05kHz和44.1kHz。图8.1cat单词中ae发声的波形图8.2.2数据量与声音质量音频信号经过数字化后产生的数据量的公式计算：例：1分钟双声道立体声，采样频率为11.025kHz，量化比特数为8，通过使用上面的公式计算，其存储容量为1.323MB。数字化激光光盘CD-DA红皮书标准采用的抽样频率是44.1kHz，量化比特数为16，双声道1分钟，其存储容量为10.584MB。音频质量越高，采样频率越大，数字化后数据量就很大。8声道数量化比特数采样频率数据量＝声音持续时间声道数量化比特数采样频率存储容量＝88.2.3音频压缩编码技术模拟音频数字化后的数据量很大，处理和传输数据的时间、和存储数据的容量也增加。因此，可采用压缩编码技术。1、音频压缩编码方法音频信号的编码方法主要分成三类：波形编码、参数编码和混合编码。波形编码：直接对离散音频信号的样值进行编码和传输；参数编码：先从离散音频信号样值中提取出反映该信号的特征值，再对特征值进行编码处理和传输；混合编码是前两种方法的综合应用。（1）波形编码常用的编码方法有：脉冲编码调制PCM；差值脉冲编码调制DPCM；自适应差值脉冲编码调制ADPCM；自适应变换编码ATC；子带编码SBC等。波形编码的优点是简单、易于实现、可获得较高的语音质量，缺点是压缩比不高。（2）参数编码语音信号可用一些描述语音特征的参数，如基音周期、共振峰频率、清/浊音判决和语音强度等来描述。发送端通过分析后提取语音的特征参数，对它们量化编码后进行传输，接收端解码后用这些参数去激励发声模型即可重构发端语音。特点：数据压缩比很高，其编码速率在2.4kb/s左右。合成语音的音质较差。由于发送端需要提取语音信号的特征参数，算法复杂，计算量大。（3）混合编码技术混合编码方法有：多脉冲线性预测（MP-LPC）；矢量和激励线性预测（VSELP）；码激励线性预测（CELP）；短延时码激励线性预测码（LD-CELP）；长延时码激励线性预测码（RPE-LTP）等。特点：提高了数据压缩比，又提高了合成语音质量2、音频压缩编码的国际标准国际电信联盟国际标准化部ITU-T（原CCITT）根据不同的质量要求，制定了一系列的音频压缩编码标准。（1）G.711标准CCITT于1972年制定的话音质量的PCM语音压缩编码标准，数据率为64kb/s，采用非均匀量化技术，处理语音频率范围为300Hz～3400Hz。（2）G.721标准CCITT于1984年制定的，采用了ADPCM技术，对中等质量音频信号进行高效编码，数据率为32kb/s，适用于语音压缩、调幅广播质量的音频压缩和CD-I音频压缩等应用中。（3）G.722标准CCITT在1988年制定的，对频率范围为50Hz～7000Hz的音频信号进行波形编码，将音频频带以4kHz为界分成高低两个子带，对每个子带采用ADPCM编码。编码数据率为64kb/s。该标准主要用于视听多媒体、会议电视等应用中。（4）G.728标准1992年CCITT制定的，使用基于短时延码本激励线性预测编码（LD—CELP）算法，编码速率为16kb/s，质量与32kb/s的G.721标准相当，编码时延仅2ms，具有高质量、低码率和低时延的特点。主要用于综合业务数字网（ISDN）。（5）G.729标准ITU-T于1995年制定的，采用共轭结构代数码激励线性预测（CS-ACELP）算法，编码速率为8kb/s，主要用于多媒体通信和IP电话等领域。（6）MPEG音频压缩标准是ISO和IEC制定的高保真立体声音频压缩编码标准。该标准按不同算法分为三个层次，层次1和层次2具有基本相同的算法。输入信号经过48、44.1和32kHz频率采样后，通过滤波器分成32个子带。编码器利用人耳的掩蔽效应，控制每一个子带的量化阶数，完成数据压缩。层次3引入了辅助子带、非均匀量化和熵编码等技术，进一步压缩数据。MPEG音频的数据率为每声道32～448kb/s。（7）AC-3系统AC-3系统不是国际标准，是Dolby公司于1992年开发的新一代高保真立体声音频编码系统，目的是为美国的全数字式高清晰度电视（HDTV）提供高质量的伴音。系统提供了5个声道的从20Hz～20kHz的全通带频响，即左、右声道、中置和两个独立环绕声声道。另外，还提供了一个100Hz以下的超低音声道，也称5.1声道。AC-3系统将6个声道的信息进行数字编码，并压缩成一个通道，比特率仅为320kb/s。AC-3系统的总体性能要优于MPEG音频标准。该系统在激光影碟（LD）、CD激光唱盘、VHS录像带、数字广播系统、电视广播和有线电视登有着广泛的应用。8.3多媒体图像视频技术8.3.1数字图像基本概念图像是一类携带信息的极其重要的媒体。人们获取信息的70%以上来自视觉系统。由于图形、图像、动画和视频等更直观体现信息的内容，因此更容易被人接受。1、颜色与RGB图像格式任何一种颜色都可用红（Red）、绿（Green）和蓝（Blue）三种基本颜色按不同的比例混合得到。某一种颜色和三种基本颜色之间的关系可用下面的式子来描述：某种颜色＝R（红色百分比）＋G（绿色百分比）＋B（蓝色百分比）如果每个像素的每个颜色分量用8位二进制码来表示，每个分量的范围是0～255，这种图像表示方式称为24位彩色方式。为了节省存储空间和便于存储器结构设计，图像表示方式可采用16位彩色方式，如5位表示R，6位表示G，5位表示B。这种方法是通过对24位彩色方式做简单的截尾得到的。在计算机显示系统中，还有一种8位彩色方式，彩色图像的每一个像素，用8位索引值表示，按照索引值在一个查找表（或称调色板）中获得该像素真正的彩色R，G，B的值。由于用8位表示的256种索引值只能表示256种颜色，而实际的彩色图像本身的色彩要丰富得多，因此，显示时有失真。2、图像的基本属性图像的基本属性有分辨率、像素深度、真/伪彩色、图像表示法和种类。(1)显示分辨率和图像分辨率显示分辨率是指显示屏上能够显示出的像素数目，显示设备的分辨率越高，显示的图像质量就越好。图像分辨率是指组成一幅图像的像素密度的度量方法。对同样大小的一幅图，如果组成该图的像素数目越多，则说明图像的分辨率越高，看起来就越逼真。相反，图像显得越粗糙。图像分辨率与显示分辨率是两个不同的概念。(2)像素深度是指存储每个像素所用的位数，像素深度决定彩色图像的每个像素可能有的颜色数，或者确定灰度图像的每个像素可能有的灰度级数。(3)真彩色和伪彩色在组成一幅彩色图像的每个像素值中，有R，G，B三个基色分量，每个基色分量直接决定显示设备的基色强度，这样产生的彩色称为真彩色。伪彩色图像的每个像素的颜色不是由每个基色分量的数值决定，而是把像素值当作彩色查找表的表项入口地址，去查找一个显示图像时使用的R，G，B强度值，用查找出的R，G，B强度值产生的彩色称为伪彩色。3、彩色空间的线性变换为了利用人的视觉特性来降低表示图像的数据量，可把RGB空间表示的彩色图像变换到其它彩色空间。常用的变换有YIQ，YUV和YCrCb三种，每一种彩色空间都会产生一种亮度分量信号和两种色度分量信号。而每一种变换使用的参数都是为了适应某种类型的显示设备。YIQ适用于NTSC彩色电视制式；YUV适用于