5.2信息资源压缩技术–几个未经压缩的数字化信息的例子:•一页印在B5(180mm×255mm)纸上的文件,若以中等分辨率(300dpi)的扫描仪进行采样,其数据量约为6.61MB/页。一片650M的CD-ROM,可存98页。•双声道立体声激光唱盘(CD-DA),采样频率为44.1kHz,采样精度16位/样本,其一秒钟时间内的采样位数为1.41Mb/s。一个650MB的CD-ROM可存约1小时的音乐。•CCIR数字电视图像,PAL制,4:4:4采样,每帧数据量720×576×3=1.24MB,每秒数据量1.24×25=31.3MB/s。一片CD-ROM可存节目时间为650/31.3=20.9秒•若帧速率为25帧/秒,则1s的数据量大约为25MB,一个640MB的光盘只能存放大约25s的动态图像•一幅640×480分辨率的24位真彩色图像的数据量约为900KB;一个100MB的硬盘只能存储约100幅静止图像画面•解决办法之一就是进行数据压缩,压缩后再进行存储和传输,到需要时再解压、还原。–以目前常用的位图格式的图像存储方式为例,像素与像素之间无论是在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大,在允许一定限度失真的前提下,能够对图像数据进行很大程度的压缩–媒体信息具有很大的压缩潜力。•多媒体声、文、图、视频等信源数据有极强的相关性,也就是说有大量的冗余信息。•利用人的感知生理、心理规律,也可以对多媒体信息进行压缩。•根据媒体应用的类型,以一定的质量损失为容限进行压缩。•数据压缩方法–无损压缩:•利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到统计冗余度理论限制,一般为2:1到5:1。•多媒体应用中经常使用的无损压缩方法主要是基于统计的编码方案,如游程编码(runlength)、Huffman编码、算术编码和LZW编码等等。•常用工具:WinRar、WinZip、ARC等•数据压缩方法–有损压缩:•利用了人类视觉和听觉器官对图像或声音中的某些频率成分不敏感的特性,允许在压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像或声音的影响较小,却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。•常用的有损压缩方法有:PCM(脉冲编码调制)、预测编码、变换编码(主要是离散余弦变换方法)、插值和外推法(空域亚采样、时域亚采样、自适应)等等。•常用工具:JPEG、MPEG等衡量一种数据压缩技术的好坏有三个重要的指标–压缩比–压缩算法简单,速度快–恢复效果要好多媒体数据依据压缩算法进行分类的方法主要有:•脉冲编码调制•预测编码•变换编码•统计编码•混合编码数据压缩原理–因为人的感觉的某些不敏感性,多媒体数据中还存在着从主观感受角度看去的大量冗余,即:在人眼允许的误差范围之内,压缩前后的图像如果不做非常细致的对比是很难觉察出两者的差别的。–原始的多媒体信源数据存在着客观上的大量冗余。信息理论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。去掉冗余不会减少信息量,仍可原样恢复数据;但若减少了熵,数据则不能完全恢复。不过在允许的范围内损失一定的熵,数据仍然可以近似恢复。统计编码:无失真编码。根据信息出现概率的分布特性进行的压缩编码。数据压缩原理预测编码:有失真编码。根据原始的离散信号之间存在关联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差进行编码。变换编码。有失真编码。对原始数据从初始空间或时间域进行数学变换,使得信号中最重要的部分在变换域中易于识别,并且集中出现,可以重点处理;相反使能量较少的部分较分散,可以进行粗处理。三个步骤:变换、变换域采样和量化。分析—合成编码。有失真编码。通过对原始数据的分析,将其分解成一系列更适合表示的“基元”或“参数”,编码仅对这些基本单元或参数进行。而译码时则借助于一定的规则或模型,按照一定的算法将这些基元或参数再“综合”成原数据的一个逼近。数据压缩技术标准H.26X。由CCITT(ConsultativeCommitteeofInternationalTelegraphandTelephone国际电报电话咨询委员会,从1993年3月1日起,改组为ITU)制定的标准。包括H.261、H.263、H.264,简称为H.26X–主要应用于实时视频通信领域–H.261:是ITU-T为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的,速率为64kb/s的整数倍。H.261只对CIF(352×288)和QCIF(176×144)两种图像格式进行处理。H.261是最早的运动图像压缩标准。数据压缩技术标准–H.263:在H.261的基础上发展而来的加强版,它借鉴了MPEG-1的优点,支持PSTN,能在低带宽上传输高质量的视频流。–H.264:由ISO/IEC(IEC,国际电工委员会)与ITU-T组成的联合视频组(JointVideoTeam,JVT)制定的新一代视频压缩编码标准。在相同的重建图像质量下,H.264比H.263+和MPEG-4减小50%码率,对信道时延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等,又可工作于无时延限制的场合,如视频存储等;提高网络适应性,加强对误码和丢包的处理,提高解码器的差错恢复能力。•5.2.2静止图像的压缩技术–静态图像压缩技术主要是对空间信息进行压缩,目的是在满足一定图像质量的条件下,缩小图像文件所占用的存储空间,从而减小存储容量和占用尽量小的网络带宽。JPEG图片–JPEG标准:用于灰度或彩色图像的压缩标准。适用于不太复杂或一般取自真实景象的图像压缩。压缩比率可达20:1或25:1。无损模式通常采用2:1压缩–JPEG2000:高压缩率、无损压缩、渐进传输、兴趣区域压缩、色彩模式、图像处理简单。JPEG标准•国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合成立的“联合图像专家组”JPEG(JointPhotographcodingExpertsGroup)于1991年提出的“多灰度静止图像的数字压缩编码”(简称JPEG标准)。•这是一个适应于彩色和单色多灰度或连续色调静止数字图像的压缩标准,是最常用的图像文件格式,是一种有损压缩,压缩比很大。静态图像的数据压缩JPEG-2000标准随着多媒体应用领域的快速增长,传统JPEG压缩技术已无法满足人们对数字化多媒体图像资料的要求。针对这些问题,专家们开始了下一代JPEG2000标准的制定,最终标准于2000年12月出台。JPEG2000的特点:高压缩率有损/无损压缩渐进传输感兴趣区域压缩色彩模式图像处理简单静态图像的数据压缩标准JPEGJPEG2000主要编码技术离散余弦变换(DCT)知觉量化Zigzag扫描霍夫曼编码算术编码离散小波变化(DWT)EBCOT核心算法ROI编码空间可扩展编码质量可扩展编码面向对象编码位图形状编码容错编码、TCQ、零数扫描压缩比2~302~50算法效率30:1以上急剧下降100:1以上急剧衰减速率失真特性比JPEG提高30%应用场合Internet数字照相图像视频编辑Internet数字照相数字图书馆电子商务打印、扫描、传真、遥感JPEG与JPEG2000的性能比较5.2.3运动视频图像的压缩技术•视频:运动图像即静止图像的连续播放状态•压缩目标:尽可能保证视觉效果的前提下减少视频数据率。•压缩比:压缩后的数据量与压缩前的数据量之比。•运动图像的数据压缩方法有损和无损压缩帧内和帧间压缩对称和不对称压缩MPEG(运动图像专家组—MovingPicturesExpertsGroup)标准是一系列视频、音频、数据的压缩标准。分成MPEG视频、MPEG音频和MPEG系统三大部分。MPEG算法除了对单幅图像进行编码外(帧内编码),还利用图像序列的相关特性去除帧间图像冗余,大大提高了视频图像的压缩比。压缩比可达到60-100倍左右,同时图像和音频的质量也非常高。运动视频图像的数据压缩•最初MPEG专家组的工作项目是3个,即在1.5Mbps,l0Mbps,40Mbps传输速率下对图像编码,分别命名为MPEG-1,MPEG-2,MPEG-3。l992年,MPEG-2适用范围扩大到HDTV,能支持MPEG-3的所有功能,因而MFEG-3被取消。•主要有:MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21运动视频图像的数据压缩MPEG-1标准•MPEG-1即“用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码”,于1992年正式出版。•MPEG-1的任务主要是,将视频信号及其伴音以可接收的重建质量压缩到约1.5Mbps的码率,并复合成一个单一的MPEG位流,同时保证视频和音频的同步。•MPEG-1是VCD视频的压缩标准。•MPEG-1视频压缩编码后包括三种元素:I帧,P帧,B帧运动视频图像的数据压缩MPEG-1标准分4个部分①MPEG系统:定义音频、视频及有关数据的同步;②MPEG视频:定义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为360×240,色度信号分辨率为180×120;③MPEG音频:定义音频数据的编码和解码;④一致性测试。运动视频图像的数据压缩MPEG-2标准•MPEG-2标准于1994年公布,包括系统部分、视频部分、音频部分及符合性测试部分。•MPEG-2编码标准希望囊括数字电视、图象通信各领域的编码标准,MPEG-2按压缩比大小的不同分成五个档次(profile),每一个档次又按图象清晰度的不同分成四种图象格式,或称为级别(level)。五个档次四种级别共有20种组合,但实际应用中有些组合不太可能出现,较常用的是11种组合。•MPEG-2是DVD视频的压缩标准。运动视频图像的数据压缩MPEG-4标准•MPEG-4标准于1998年公布,是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带度,采用了全新的压缩理念,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量,并将之作为网络上传送之用。•MPEG-4可把DVD内MPEG-2的视频文件转换为体积更小的文件。还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。运动视频图像的数据压缩MPEG-7标准•MPEG-7是“多媒体内容描述接口”,(MultimediaContentDescriptionInterface)。准确说来,MPEG-7并不是一种压缩编码方法,继MPEG-4之后,要解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索。MPEG7就是针对这个矛盾的解决方案。•其目标就是产生一种描述多媒体信息的标准,并将该描述与所描述的内容相联系,以实现快速有效的检索。只有首先解决了多媒体信息的规范化描述后,才能更好地实现信息定位。该标准不包括对描述特征的自动提取。运动视频图像的数据压缩•MPEG-7标准可以独立于其他MPEG标准使用,MPEG-7的适用范围广泛,既可以应用于存储,也可以用于流式应用,它还可以在实时或非实时的环境下应用。MPEG-7的应用领域包括:◇数字图书馆(如图像目录、音乐词典等);◇多媒体目录服务(如黄页);广播媒体的选择(如无线电频道、TV频道等);◇多媒体编辑(如个人电子新闻服务,多媒体创作等)。◇潜在的应用领域包括:教育、娱乐、新闻、旅游、医疗、购物、地理信息系统等领域。运动视频图像的数据压缩MPEG-21标准•MPEG-21标准是多媒体框架和综合应用方面的框架。该标准致力于在大范围的网络上实现透明的传输和对多媒体资源的充分利用。•其目标就是将各种标准集成起来以协调各种技术,管理多媒体商务。运动视频图像的数据压缩RM/RMVB•RM(RealMedia)是RealNetworks公司所制定的音频视频压缩规范,是一种流媒体格式。用户可以使用RealPlayer或RealOn