多媒体技术饶志坚多媒体概念在计算机领域中,媒体(Medium),也称为媒介、或媒质,通常有两种含义:一是指用以存储信息的实体,如磁带、磁盘、光盘和半导体存储器等;二是指传递信息的载体,如数字、文字、声音、图像和图形等。多媒体技术多媒体技术就是综合处理图、文、声、像信息,并使之具有集成性和交互性的计算机技术。多媒体技术处理信息需要通过计算机数字化的采集、获取、压缩与解压缩、编辑、存储等加工处理。多媒体技术主要包括数据压缩与解压缩、媒体同步、多媒体网络传输等关键技术。文本媒体声音媒体图形图像动画视频虚拟现实技术文本媒体1、文本的输入方式键盘输入、手写输入、语音录入、扫描文字识别(OCR)2、文本处理软件3、文本文件格式.TXT.DOC(DOCX).CHM.RTF.PDF.WPS4、文本格式的转变声音媒体声音的三要素人耳对不同强度、不同频率声音的听觉范围称为声域响度、音高、音色称为声音的“三要素”。影响数字音频质量的技术指标(1)采样频率(2)量化位数(3)声道数图中的正弦曲线代表原始音频曲线;填了颜色的方格代表采样后得到的结果,二者越吻合说明采样结果越好。横坐标便是采样频率;纵坐标便是采样分辨率。采样频率kHz采样精度位所需存储容量MB数据速率KB/s常用编码方法质量与应用44.11610.09488.2PCM相当于激光唱片质量,应用于高质量要求的场合22.05165.04744.1ADPCM相当于调频广播质量,可应用于伴音及各种音响效果82.52322.05ADPCM11.025162.52322.05ADPCM相当于调幅广播质量,可用于伴音或解说词81.26211.025ADPCM多媒体技术中的数字音频技术包括三个方面的内容:①声音采集及回放技术。②声音识别技术。③声音合成技术。声音识别技术人类使用的文字大致可分为两类:拼音文字和象形文字。拼音文字在学习、拼写、阅读、自动化控制(如计算机)等方面有着绝对的优势。计算机技术发展到今天这个水平,拼音文字起着关键性的作用。汉字作为一种象形文字,伴随着计算机技术的发展,其发音方式在计算机的语音识别中却有着突出的优点。同英语相比,汉语语音有着明显的音节,这就使汉语在计算机语音命令处理中成为最优秀的语言。常用的语音识别系统MicrosoftIBMViaVoiceNaturallySpeaking声音合成技术声音合成技术主要用于语音合成和音乐合成(MIDI音乐)。1.语音合成技术的作用刚好与语音识别作用相反。语音识别是将语音转换成为文本(文字)或代码。而语音合成则是将是文本(文字)或代码转换成相应的发音。2.MIDI音乐应属于合成音乐。常用软件MidiSoftStudioCakewalkProAudioExcel中的语音音频类型和格式波形文件和MIDI文件CD格式:天簌WAV:无损APE:无损压缩MP3:流行MIDI:作曲家声音文件比较音频数据的采集、使用、编辑和转换录音处理声音编辑(1)噪音处理(2)音调调整(3)特殊效果(4)静音处理混响处理乐器调音MuseBookTuner古筝一般是调成D调,D调的12356分别对应着校音软件上的:DE#FAB图形、图像图形通常是指人们用工具在纸或其他平面上画出来的物体的形状。它们以点、线、面等几何形状及相应色彩为组成元素,组合成表现事物形状的可视画面,表达和储存事物的信息。图像通常指人们描绘、摄影、扫描或印制成的物体的平面形象或影像。它们以对应原物体的映像点及其色彩和光线为组成元素,反映出表现事物形象和影像的可视画面,再现和记录事物的信息。图形图像素材采集直接使用图像素材库资源从屏幕上抓取图像采集素材使用扫描仪采集图像素材使用数码相机采集图像素材用软件直接绘制图像素材关于分辨率“分辨率”指的是单位长度中,所表达或包含的像素数目。(1)图像分辨率(2)显示分辨率(3)打印分辨率图像颜色位图图像中每个像素上用于表示颜色的二进制数字位数称为图像深度(也称图像灰度、颜色深度),用n表示。所能表示的色彩数为2n黑白图像:n=1灰度图像:n=8彩色图像:每个像素的信息由RGB三原色构成的图像,其中RBG是由不同的灰度级来描述的,n=24图形图像的文件格式BMPGIFTIFFJPGPSDWMFoffice剪贴画WMF的使用和编辑GIF文件GIF文件格式采用了LZW无损压缩算法按扫描行压缩图像数据。它可以在一个文件中存放多幅彩色图像,每一幅图像都由一个图像描述符、可选的局部彩色表和图像数据组成。如果把存储于一个文件中的多幅图像逐幅读出来显示到屏幕上,可以像播放幻灯片那样显示或者构成简单的动画效果。GIF的图像深度从1位~8位,即最多支持256种色彩的图像。JPGJPEG是JointPhotographicExpertsGroup(联合图像专家组)的缩写,文件后辍名为.jpg或.jpeg,是最常用的图像文件格式,由一个软件开发联合会组织制定,是一种有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低,如果追求高品质图像,不宜采用过高压缩比例。但是JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像品质。看图软件AcdseeGooglePicasa照片管理软件光影魔术师图像处理软件AdobePhotoShopCorelDraw动态图像的编辑制作(动画视频)一、动画计算机设计动画有两种:一种是帧动画,一种是造型动画。二、动画文件格式SWF、3DS、MOV、GIFFlash动画SWF是Micromedia公司的产品Flash的向量动画格式,它采用曲线方程描述其内容,因此这种格式的动画在缩放时不会失真,非常适合描述由几何图形组成的动画,如教学演示等。由于这种格式的动画可以与HTML档充分结合,并能添加MP3音乐,因此被广泛地应用于网页上,成为一种“准”流式媒体文件。Flash动画制作Flash软件SWish软件视频1、模拟视频和数字视频2、模拟视频的数字化数字视频的采样Y:U:V4:1:1、4:2:2和4:4:4数字视频标准:采样频率为fs=13.5MHzPAL与NTSCPAL与NTSC的区别电影放映的时候都是每秒24个胶片帧。PAL制式每秒50场,NTSC制是每秒60场,由于现在的电视都是隔行场,所以可以大概认为PAL制每秒25个完整视频帧,NSTC制30个完整视频帧。视频的相关参数分辩率帧率VCD352x240像素,每秒29.97幅画面(适合NTSC制式电视播放);352x240像素,每秒23.976幅画面;352x288像素,每秒25幅画面(适合PAL制式电视播放)DVDDVD的分辨率:720×480[NTSC制式]720×576[PAL制式]标清StandardDefinition物理分辨率在720p以下的一种视频格式。指分辨率在400线左右的VCD、DVD、电视节目等“标清”视频格式,即标准清晰度。而物理分辨率达到720p以上则称作为高清。高清HighDefinition意思是“高分辨率”。一般所说的高清,有四个含义:高清电视,高清设备,高清格式,高清电影。高清电视,又叫“HDTV”,是由美国电影电视工程师协会确定的高清晰度电视标准格式。电视的清晰度,是以水平扫描线数作为计量的。什么是高清电视?“高清晰度数字电视”:包括:高清电视节目源、高清机顶盒、高清电视机和必要的传输网络。高清电视图像分辨率成倍提高,达到1920×1080,而标清数字电视分辨率仅为720×576。高清采用的宽高比为16:9的大屏幕播映方式。从音频效果看,高清电视节目将支持杜比5.1声道环绕声,而高清影片节目支持杜比5.1TrueHD规格。VCD/DVD/标清/高清i和p的意义标准清晰度又称SDTV,分辨率为704×576i。高清晰度又称为HDTV,分为三种,分别是720P(1280×720p),1080i(1920×1080i),1080p(1920×1080p)。带”i”的是隔行扫描,后缀为P的表示逐行扫描。模拟视频接口RFRACD端子3RACD-SUB…射频RF接口天线和模拟闭路连接电视机就是采用射频(RF)接口。作为最常见的视频连接方式,它可同时传输模拟视频以及音频信号。复合视频信号(CVBS)接口最简单、最原始的视频接口,常称的RCA接口。黄色的为视频信号,白色的为左声道音频信号,红色的为右声道音频信号。S端子接口S-Video随着摄影机、S-VHS录像机的发展,出现了S端子接口。将亮度信号Y和色度信号C分开传输。确保亮度信号不会受到色度信号的干扰。SCART接口欧洲厂商统一起来,使用SCART接口,传输的是RGB三原色信号。D端子日本厂商发展D端子,传输的是色差分量信号D1:525i(普通NTSC525行隔行信号)D2:525i,525pD3:525i,525p,1125iD4:525i,525p,1125i,750pD5:525i,525p,1125i,750p,1125p注:525i也习惯称480i,525p也习惯称480p,1125i也习惯称1080i,750p也习惯称720p。色差端子/3RCA(Y/Pb/Pr)美国人则延续了使用RCA端子的传统,使用3个RCA端子来传输色差分量信号。D-SUB9(VGA端子)数字视频接口USBIEEE1394DVIHDMIUSB只适合用来传输静态图片如数码相机的JPG照片或低质量的动态图像,而不适合传输动态高清晰度图像。IEEE1394(i.Link/DV接口)传输的最高数据率是400MBPS。DVI接口8GBPS(165MHZx24bitx2),适合传输无压缩、高清晰度视频信号。最高支持QXGA(2048x1536)格式。不少显卡都具有DVI输出,DVI是现在等离子显示器的标准输入接口。HDMI(DVI-CE)接口支持HDTV信号的无压缩传输,并支持8声道96KHZ或1个声道的192KHZ数字伴音。这样就可以使用一根线完成高清晰度图像和数字伴音的传播。HDCP保护协议。HTPC家庭影院个人电脑不追求高性能为惟一目标,它应该是外观,性能、噪音,功耗4者平衡的产物。HD-DVD与BD光存储介质DB:25GB单面双层可达50GBHD-DVD:15GB单面3层达45GB视频压缩标准1、国际电联压缩编码标准H.261H.263H.264等2、JPEG压缩编码标准3、MPEG压缩编码标准MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准4、DVI压缩编码标准视频编码技术H.264(MPEG4-AVC)常见的视频文件格式AVI格式MPEG格式MOVRMVB格式RM格式MKVMP4/3GPWMV格式FLVAVI容器AVI是微软1992年推出用于对抗苹果Quicktime的技术,尽管国际学术界公认AVI已经属于被淘汰的技术,但是由于windows的通用性,和简单易懂的开发API,还在被广泛使用。AVI本身只是提供了这么一个框架,内部的图像数据和声音顺据格式可以是任意的编码形式。因为索引放在了文件尾部,所以在播internet流媒体时已属力不从心。很简单的例子,从网络上下载的片子,如果没有下载完成,是很难正常播放出来。VirtualDub提出了一种新的方法扩充了AVI对VBR音频的兼容,但是在高码率时会产生丢失数据的问题,从而导致有损音效。但对TrueHD,DTS-HD等音效更是完全不能支持。MKV是Matroska的一种媒体文件,Matroska是一种新的多媒体封装格式,它可将多种不同编码的视频及16条以上不同格式的音频和不同语言的字幕流封装到一个MatroskaMedia文件当中!视频文件转换软件