计算机基础Ⅰ数学计算机科学学院第5章多媒体技术数学计算机科学学院2内容提要5.1文本5.2图像5.3图形5.4音频5.5视频数学计算机科学学院35.1文本文本是文字、字母、数字和各种功能符号的集合。在多媒体作品中,文本是最基本也是最常用的素材,主要用于记载和存储文字信息,一些说明、介绍、作品中的文字资料都会用到文本。5.1.1文本的分类几种比较流行的文本文件格式:TXT格式DOC/DOCX格式RTF格式WPS格式PDF格式CAJ格式HTML超文本格式数学计算机科学学院45.1.2文本的录入多媒体计算机系统中,文本资料可以用多种方式获取。键盘输入OCR文字识别输入语音识别输入联机手写识别输入数学计算机科学学院55.1.3文本处理工具文字处理软件种类较多,各具特色,常见的有:记事本写字板MicrosoftWordWPS文字数学计算机科学学院65.2图像图像是指用数码摄像机、扫描仪等输入设备捕捉实际的画面并经过采样和数字化后得到的一个由像素点阵构成的画面,每个像素的颜色和亮度都由一定的比特位来描述。图像又称为点位图、点阵图、像素图、光栅图。数学计算机科学学院75.2.1图像的获取多种获取方式:使用数码相机拍照获取扫描获取通过软件绘制获取从屏幕中捕捉获取使用现有图像获取数学计算机科学学院85.2.2图像的存储1.图像的存储方式像素(pixel)一幅图像就是一个矩形点阵,上面的每一个点称之为像素,像素是数字图像中的基本单位。分辨率每英寸显示的像素数即图像的分辨率,其基本单位是ppi(pixelsperinch),也可使用单位dpi(dotsperinch)。灰度值各个像素所具有的明暗程度的标识。数学计算机科学学院95.2.2图像的存储2.常见的图像格式BMP格式GIF格式JPEG/JPG格式TIFF格式PNG格式PSD格式数学计算机科学学院105.2.3图像的处理与应用1.图像处理技术2.图像处理软件3.图像处理的应用领域数学计算机科学学院111.图像处理技术图像数字化(1)采样(2)量化图像增强和恢复图像分割图像压缩与编码图像分析图像识别数学计算机科学学院122.图像处理软件数学计算机科学学院13常见的图像处理软件3.图像处理的应用领域文字、图形、图像的自动识别医学图像处理遥感图像处理智能机器人视觉技术数学计算机科学学院145.3图形图形是指由外部轮廓线条构成的矢量图,通常是由点、线、面、体等几何元素和灰度、色彩、线型、线宽等非几何属性组成的几何图形。数学计算机科学学院155.3.1图形的概念图形是用数学方法描述的一系列点、线、弧、面、体和其他几何形状,如图所示。计算机图形学是研究怎样用计算机生成、处理和显示图形的学科。它主要研究用计算机及其图形设备输入、表示、变换、运算和输出图形的原理、算法及系统。数学计算机科学学院165.3.1图形的概念存放图形所使用的格式称为矢量图格式,存储的数据主要是绘制图形的数学描述,通常是一组绘图指令集合,如描述构成该图的各种图元位置维数、形状、运算关系及颜色数据等。矢量图可任意缩放也不会失真,而图像则不同,图像与分辨率有关,所以放大会出现锯齿状边缘。数学计算机科学学院175.3.2图形的格式DXF格式CDR格式SVG格式DWG格式WMF格式数学计算机科学学院185.4音频声音是人们用来传递信息和交流情感的最直接和最方便的方式之一。处理声音之前要把声音数字化,只有数字化的声音才能使用计算机处理。数字化的声音叫做“数字音频”。数学计算机科学学院195.4.1声音信号的数字化处理声音之前,首先要把连续的模拟形式的自然声音转换成离散的数字化声音,数字化的过程主要包括采样、量化和编码三个步骤,如图所示。音频信号数字化的基本过程数学计算机科学学院20模拟音频量化采样编码数字音频5.4.1声音信号的数字化1.采样自然声信号是连续变化的,而数字化的声音则是阶跃变化的。在时间轴上,每隔一个固定的时间间隔(虚线表示)对波形信号的振幅进行一次取值,这就是采样。2.量化量化处理就是把幅度上连续取值的模拟量转换为离散量。3.编码编码是将量化后的采样值用二进制的数码来表示,并转换成由许多位的二进制编码0和1组成的数字信号。数学计算机科学学院215.4.2声音的存储1.声音的存储表示在计算机中,所有的资料都是以数字形式(0和1)存储的,声音也不例外。未经压缩的数字音频的数据量可由下式进行计算:数据量(Byte)=采样频率(Hz)×(量化位数/8)×声道数×持续时间(s)例如,采样频率为44.1KHz,量化位数16,双声道存储的5分钟数字音频的数据量为:数据量=44100×(16/8)×2×300=52920000B(约合50.47MB)数学计算机科学学院225.4.2声音的存储2.声音文件的分类1)WAV格式2)MIDl文件格式3)CDA格式4)MP3格式5)RA格式6)WMA格式数学计算机科学学院235.4.3声音的处理与应用1.声音的处理1)数字声音的录制2)声音文件格式的转换3)声音的剪辑4)合成声音5)其他效果6)高级处理2.声音处理软件声音处理软件的主要功能是实现音频的二次编辑,达到改变音乐风格和多音频混合编辑的目的。数学计算机科学学院245.4.4语音识别技术1.概念语音识别技术,也被称为自动语音识别(AutomaticSpeechRecognition,简称ASR),其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索和简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。数学计算机科学学院255.4.4语音识别技术2.语音识别技术在Windows7中的应用在Windows7操作系统中带有语音识别的功能,用户可以暂时抛开键盘的束缚,跟计算机直接对话交流,从而运行程序,比如播放影音、打开网页和输入文字等。用户在使用之前必须启动语音识别功能。首先,把麦克风正确接入计算机;其次,启动Windows7的语音识别功能(开始→控制面板→轻松访问→语音识别);第三步,进入语音识别项目后,选择“启动语音识别”这一选项。数学计算机科学学院265.4.4语音识别技术3.语音技术在MSOffice2010中的应用除了Windows7的语音输入功能在办公自动化(OA)软件中的应用之外,MSOffice2010应用程序中也有一个非常实用的功能,就是可以使用TTS(Text-To-Speech)语音引擎,实现语音功能。数学计算机科学学院275.5视频视频,也称为影像视频,就其本质而言是指内容随时间变化的一组动态图像,所以又叫运动图像或者活动图像。视频信号分为模拟视频信号和数字视频信号两大类。模拟信号指信号幅度的取值是连续的,幅值可以由无限个数值表示;数字信号指信号幅度的取值是离散的,幅值表示被限制在有限个数值之内。处理视频之前,要把连续的模拟视频信号转换成离散的计算机可以显示和处理的数字信号。数学计算机科学学院285.5.1视频信号的数字化视频模拟信号的数字化一般包括以下几个步骤:1.采样通过周期性地以某一规定间隔截取模拟信号,从而将连续的模拟视频信号变换为离散的数字信号的过程。2.量化把经过抽样得到的瞬时值变为离散值,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示。3.编码将量化后的采样值用二进制的数码来表示,并转换成由许多位的二进制编码0和1组成的数字信号。编码有压缩与非压缩两种格式。数学计算机科学学院295.5.2视频的存储表示数字化的视频文件格式主要分为以下几大类:1.MOV格式2.MPEG格式3.AVI格式4.RM格式5.RMVB格式6.WMV格式7.ASF格式8.FLV格式数学计算机科学学院305.5.3视频的处理与应用1.视频的处理1)视频剪辑2)视频叠加3)视频和声音同步4)为视频配音5)添加字幕和特殊效果2.视频处理软件视频处理软件的主要功能有视频的播放、输入、剪辑、字幕、特效、转场(过渡)和输出等。数学计算机科学学院315.5.3视频的处理与应用3.视频处理技术的应用1)视频会议2)视频点播3)虚拟现实4)远程教育数学计算机科学学院325.5.4计算机动画1.计算机动画的概念计算机动画是指由许多帧静止的画面,以一定的速度(如每秒16张)连续播放时,人们肉眼因视觉残像产生错觉,而误以为画面活动的作品。2.常见的动画格式1)GIF格式2)SWF格式3)FLC格式4)AVI格式数学计算机科学学院335.5.4计算机动画3.动画处理软件数学计算机科学学院34数学计算机科学学院35本章小结本章首先介绍了多媒体的概念和基本素材;然后分别介绍了文本、图像和图形、音频、视频等几类多媒体主要元素的概念、特点、存储表示、处理和相关应用。希望读者通过本章的学习,能对计算机多媒体技术中的相关概念有所了解,了解各种多媒体处理软件,配合实验教材使用最常用的多媒体处理软件进行多媒体作品的播放、制作和编辑,在现实生活中能结合所学知识对多媒体信息进行合理利用。数学计算机科学学院36