《多媒体技术基础(第2版)》练习与思考题参考答案第1章多媒体技术概要1.1多媒体是什么?多媒体是融合两种或者两种以上媒体的一种人—机交互式信息交流和传播媒体。使用的媒体包括文字、图形、图像、声音、动画和电视图像(video)。1.2超文本的核心思想是什么?超文本系统和超媒体系统有什么差别?(1)超文本是通过复杂的、非顺序的关联关系连接在一起的一种文本,其真正含义是“链接”的意思。(2)超文本系统是以文本为主并使用超链接构成的信息系统;超媒体系统除文本外还包含图像、音乐、动画或其他元素构成并使用超链接构成的全球信息系统。1.3超媒体是什么?多媒体与超媒体之间有什么关系?(1)使用文本、图形、图像、声音和电视图像等媒体任意组合的一种交互式信息传播媒体。(2)多媒体是超媒体系统中的一个子集。1.4SGML是什么语言?HTML是什么语言?它们之间有何关系?(1)1986年国际标准化组织(ISO)采用的一个信息管理标准。该标准定义独立于平台和应用的文本文档的格式、索引和链接信息,为用户提供一种类似于语法的机制,用来定义文档的结构和指示文档结构的标签。(2)HTML是万维网上的文档所用的标记语言。(3)HTML是SGML的一个子集。SGML使用标签来标志文档中的文本或图形之类的元素,并告诉Web浏览器该如何向用户显示这些元素,以及应该如何响应用户的行为,例如当用户通过按键或鼠标单击某个链接时该如何响应。1.5有人认为“因特网就是万维网”,这种看法对不对?为什么?(1)不对。(2)因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于TCP/IP协议的计算机网络;万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。1.6多媒体、万维网和因特网之间有何关系?多媒体构成了超媒体系统,超媒体系统构成了万维网,万维网是因特网上使用TCP/IP协议和UDP/IP协议的应用系统。第2章数字声音及MIDI简介2.1音频信号的频率范围大约多少?话音信号频率范围大约多少?(1)Audio:20~20000Hz(2)Speech:300~3400Hz2.2什么叫做模拟信号?什么叫做数字信号?(1)幅度或频率发生连续变化的一种信号。(2)以二进制代码形式表示有无或者高低的一种信号。2.3什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?(1)采样:在某些特定的时刻对模拟信号进行测量的过程。(2)量化:幅值连续的模拟信号转化成为幅值离散的数字信号的过程。(3)线性量化:在量化时,信号幅度的划分是等间隔的量化。(4)非线性量化:在量化时,信号幅度的划分是非等间隔的量化。2.4采样频率根据什么原则来确定?奈奎斯特理论和声音信号本身的最高频率。2.5样本精度为8位的信噪比等于多少分贝?48分贝2.6声音有哪几种等级?它们的频率范围分别是什么?见表2-01。2.7选择采样频率为22.050kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=1024×1024B)(22050×2×2×2×60)/(1024×1024)=10.09MB2.8什么叫做MIDI?它有什么特点?(1)音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议。(2)文件比较小;容易编辑等2.9用自己的语言说明FM合成声音和乐音样本合成声音的思想。(1)把几种乐音的波形用数字表达,用计算机把它们组合起来,通过数模转换器(DAC)来生成乐音。(2)把真实乐器发出的声音以数字的形式记录下来,播放时改变播放速度,从而改变音调周期,生成各种音阶的音符。第3章话音编码3.1用自己的语言说出下面3种话音编译码器的基本想法。①波形编译码器,②音源编译码器,③混合编译码器(1)波形编译码器:不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽可能地一致。(2)企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。(3)企图填补波形编译码和音源编译码之间的间隔。波形编译码器虽然可提供高话音的质量,但数据率低于16kb/s的情况下,在技术上还没有解决音质的问题;声码器的数据率虽然可降到2.4kb/s甚至更低,但它的音质根本不能与自然话音相提并论。3.2列出你所知道的话音编译码器的主要指标(至少2个)音质,数据速率3.3试说混合编译码器的发展过程为了得到音质高而数据率又低的编译码器,历史上出现过很多形式的混合编译码器,但最成功并且普遍使用的编译码器是时域合成-分析(analysis-by-synthesis,AbS)编译码器。这种编译码器使用的声道线性预测滤波器模型与线性预测编码(linearpredictivecoding,LPC)使用的模型相同,不使用两个状态(有声/无声)的模型来寻找滤波器的输入激励信号,而是企图寻找这样一种激励信号,使用这种信号激励产生的波形尽可能接近于原始话音的波形。AbS编译码器由Atal和Remde在1982年首次提出,并命名为多脉冲激励(multi-pulseexcited,MPE)编译码器,在此基础上随后出现的是等间隔脉冲激励(regular-pulseexcited,RPE)编译码器、码激励线性预测CELP(codeexcitedlinearpredictive)编译码器和混合激励线性预测(mixedexcitationlinearprediction,MELP)等编译码器。3.4什么叫做均匀量化?什么叫做非均匀量化?(1)均匀量化:采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。(2)非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如,对大的输入信号采用大的量化间隔,对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。3.5什么叫做μ率压扩?什么叫做A率压扩?(1)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在北美PCM电话网中,使用μ率压扩算法,详见“3.2.4μ律压扩”。(2)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在欧洲电话网,使用A律压扩算法,详见“3.2.5A律压扩”对于采样频率为8kHz,样本精度为13比特、14比特或16比特的输入信号,使用μ律压扩编码或使用A律压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64kb/s。3.6G.711标准定义的输出数据率是多少?T1的数据率是多少?T2的数据率是多少?(1)G.711使用μ率和A率压缩算法,信号带宽为3.4kHz,压缩后的数据率为64kb/s。(2)T1总传输率:1.544Mb/s。(2)T2总传输率:6.312Mb/s。3.7图3-23是DM编码器的原理图,如果你已经学过模拟电路和数字电路技术基础,请分析该电路是如何完成增量调制编码的。(略)3.8自适应脉冲编码调制(APCM)的基本思想是什么?根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。3.9差分脉冲编码调制(DPCM)的基本思想是什么?利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值,这就降低了传送或存储的数据量。此外,它还能适应大范围变化的输入信号。3.10自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么?ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值。②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。第4章无损数据压缩4.1现有8个待编码的符号m0,…,m7它们的概率如表练习_表1所示。使用哈夫曼编码算法求出这8个符号的所分配的代码,并填入表中。(答案不惟一。参考答案:1,000,001,011,0101,01000,010010,010011)练习_表1待编码的符号概率分配的代码代码长度(比特数)m00.411m10.20003m20.150013m30.100113m40.0701014m50.04010005m60.030100106m70.0101001164.2字符流的输入如练习_表2所示,使用LZW算法计算输出的码字流。如果对本章介绍的LZW算法不打算进行改进,并且使用练习_表3进行计算,请核对计算的输出码字流是否为:(1)(2)(4)(3)(5)(8)(1)(10)(11).并将码字流中的码字填入练习_表2对应的位置。练习_表2输入位置1234567891011121314151617…输入字符流Ababcbababaaaaaaa…输出码字Ab-abc-bababa-aa--aaa练习_表3步骤位置词典输出码字(1)a(2)b(3)c11(4)ab(1)22(5)ba(2)34(6)Abc(4)45(7)Cb(3)57(8)Bab(5)610(9)Baba(8)711(10)Aa(1)813(11)Aaa(10)916(12)Aaa(11)……………4.3LZ78算法和LZ77算法的差别在哪里?(1)LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2LZ77算法)(2)LZ78的编码思想是不断地从字符流中提取新的缀-符串(String),通俗地理解为新“词条”,然后用“代号”也就是码字(Codeword)表示这个“词条”。这样一来,对字符流的编码就变成了用码字(Codeword)去替换字符流(Charstream),生成码字流(Codestream),从而达到压缩数据的目的。(4.4.4LZ78算法)4.4LZSS算法和LZ77算法的核心思想是什么?它们之间有什么差别?(1)LZ77通过输出真实字符解决了在窗口中出现没有匹配串的问题,但这个解决方案包含有冗余信息。(4.4.3LZSS算法)(2)LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2LZ77算法)4.5LZW算法和LZ78算法的核心思想是什么?它们之间有什么差别?(1)LZW算法和LZ78算法的核心思想都是不断地从字符流中提取新的缀-符串(String),通俗地理解为新“词条”,然后用“代号”也就是码字(Codeword)表示这个“词条”。这样一来,对字符流的编码就变成了用码字(Codeword)去替换字符流(Charstream),生成码字流(Codestream),从而达到压缩数据的目的。(4.4.4LZ78算法)(2)在LZW算法中使用的术语与LZ78使用的相同,仅增加了一个术语—前缀根(Root),它是由单个字符串组成的缀-符串(String)。在编码原理上,LZW与LZ78相比有如下差别:①LZW只输出代表词典中的缀-符串(String)的码字(codeword)。这就意味在开始时词典不能是空的,它必须包含可能在字符流出现中的所有单个字符,即前缀根(Root)。②由于所有可能出现的单个字符都事先包含在词典中,每个编码步骤开始时都使用一字符前缀(one-characterprefix),因此在词典中搜索的第1个缀-符串有两个字符。(4.4.5LZW算法)第5章彩色数字图像基础5.1什么叫做真彩色和伪彩色?在一幅彩色图像中,每个像素值有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色