信息技术必修1第一章数据与信息信息技术必修1《数据与计算》信息技术必修11.2数据编码3信息技术必修1数据编码字符编码图像编码声音编码视频编码模拟信号与数字信号数据编码【了解】信号的基础概念信号是表示消息的物理量。比如:声、光信号是人的感官所能识别和接收的信号。采用计算机完成事物符号化、数据化的过程包含理解、抽象、推理。计算机将它们处理转换成0和1组成的二进制编码,进而采用基于二进制的算术运算和逻辑运算进行处理。1.2.1模拟信号与数字信号6【例】观看微课《模拟信号与数字信号》,分析、比较模拟信号与数字信号的特点和异同,并在记录表中回答问题。思考1:传统有线电话、电台广播电视,是通过什么信号传递信息?思考2:现代计算机网络,是通过什么信号传递信息?交流:10月1日国庆节,北京天安门将举行盛大的阅兵仪式,你会选择哪种方式,观看阅兵仪式呢?为什么?1.2.1模拟信号与数字信号7思考1:模拟信号思考2:数字信号【了解】模拟信号模拟信号是指用连续变化的物理量所表达的信息。1.2.1模拟信号与数字信号8模拟信号是传导能量的一种方式,其幅度、频率或相位随时间作连续变化。常见的模拟信号应用:有线相连的电话和无线发送的广播电视。【了解】模拟信号模拟信号的波形可以是简单的,也可以是复杂的。可以是仅仅包括一个单一频率,也可以是复杂波形,包含了许多不同频率的组合。模拟信号是传导能量的一种方式。例如,声波通过空气等介质来向远处传送能量,在传播的过程中,能量会不断被损耗而逐渐衰减。1.2.1模拟信号与数字信号9多频率组合波形示意图模拟信号的衰减示意图【理解】数字信号数字信号是离散时间信号的数字化表示。其信号的自变量、因变量都是离散的。1.2.1模拟信号与数字信号10在计算机中,数字信号的大小常用有限位的二进制数表示。【例】字长为2位的二进制数可表示00、01、10和11四种数字信号。常见的数字信号应用:开关电路中输出电压和电流脉冲的信号。【例】模拟信号与数字信号优缺点对比1.2.1模拟信号与数字信号11第1章数据与信息\数据编码名称优点缺点模拟信号数字信号进行远距离传输时哪种信号比较好?简单容易实现保密性差,抗干扰能力弱抗干扰能力强,保密性、可靠性强技术实现复杂,占用频带宽模拟信号,因为在远距离传送时,为防止信号畸变,一般采用频带传输,即将数字信号变换成便于在通信线路中传输的交流信号进行传输。编码的基本方式数据编码计算机中所有的信息都是用“0”和“1”来表示的。在实际中信息的形式是多种多样的,最常见的是文字、声音、图片等等。要用计算机来处理信息,就需要先把这些信息转化为“0”和“1”的数据形式,即信息数字化。计算机中的文字、数字、声音、视频都是通过二进制编码来表示的。只是表示信息类型不同,编码方案也不同。数据编码文字(字符)编码是效率相对较低的编码方式,有单字节码和双字节码两种。ASCII码、莫尔斯码属于单字节码,国标码(GBK)、统一码(Unicode)属于双字节码。文字编码15常用的不可见控制符(33个)以及标点符号、运算符号等33个英文字母(大小写52个)阿拉伯数字(10个)记住几个常见字符的ASCII码值:英文字母A01000001(十进制数65)a的编码分别为01100001(十进制数97)0为48ASCII码(英文字符编码)【例】ASCII码采用7位二进制编码,共表示多少个字符?1.2.2编码的基本方式17【例】英文字母A的ASCII码为01000001,英文字母B的ASCII码转化为十进制后是多少?答:用7位二进制数,也就是27个字符,共128个答:英文字母B的ASCII码01000010(十进制数66)【例】A公司设计一款数学公式编辑软件,需要将50个常用的数学符号编码成二进制,请问至少需要多少位来表示?1.2.2编码的基本方式18【例】如果将ASCII编码表中的128个字符改为用八进制编码,请问至少需要多少位来表示?答:用6位二进制数,因为26=6460。答:用3位八进制数,因为83=512128。【思考题】在计算机中,英文字母、数字、符号等都可用ASCII码来表示,如大写字母“C”的编码为8位二进制数01000011,数字“9”的编码为00111001等。可是,中文却难以用ASCII码来表示。如果要设计一套汉字的编码系统,可以如何进行?仿照ASCII编码系统的方法,描述大致的设计思路,并在小组内交流。1.2.2编码的基本方式19第1章数据与信息\数据编码【参考思路】可以参照四角号码查字法来进行中文编码。在四角号码查字法中保留了横、竖、撇、捺这些基本笔画,并称之为单笔,同时增加了一些称之为复笔的构字单位,它们是多个基本笔画的组合。四角号码查字法根据汉字所含的单笔或复笔对汉字编号,它是不依书写笔顺的,而是取汉字左上角、右上角、左下角、右下角四个角的单笔或复笔的笔形,这样共有四码,一个汉字用四个数字表示。(2)国标码。目的为了使每个汉字有一个全国统一的代码而颁布了汉字编码的国家标准。每个汉字有个二进制编码,叫汉字国标码。每个汉字使用2个字节,主要分为两部分:编号127之前的符号跟ASCII码所表示的意义相同,属于单字节码;编号127之后的符号统一用两个字节表示,包含了几乎所有的简体中文字(中文编码高字节的最高位不为0)。1.2.2编码的基本方式20数据编码汉字的编码输入码又叫“外码”,按照汉字的读音进行编码,例如:双拼、智能ABC、微软拼音输入法、紫光拼音输入法;按照形状进行编码,例如:五笔、二笔、郑码、表形码;机内码用于存储汉字的编码GB2312-80——简称GB码,由两个字节组成(16位二进制数),即存储一个汉字2个字节,如:1101010011000110——云1100010011001111——南含6763个汉字。港台地区的BIG5码——繁体字。近来我国用的GB1300编码,含20902个汉字。字形码又叫输出码或字模,是描述每个汉字形状的编码,即汉字显示的代码,如:点阵法和矢量法16*16,24*24,32*32,48*48点阵10*10编码文字编码与进制数的关系文字编码必须保证唯一性,即一个“码”只能表示一个“字符”。因此,由N位二进制数组成的编码,最多可以表示2N个字符例:两位二进制数编码最多能表示的字符数为22个字符,即4个字符00011011思考:四位二进制数编码最多能表示的字符数为?个字符,即?个字符24个字符,即16个字符,分别为000000010010……1111某公司想为每个员工分配一个唯一的二进制位ID,以便计算机管理。如果有500名员工,则最少需要多少位来表示?提示:28=25629=512210=10249位如果又增加了200名员工,则是否需要调整位数?如果需要调整应该调整到多少位合适?需要10位例题:(3)统一码(Unicode)统一码,也叫万国码、单一码(Unicode)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求1.2.2编码的基本方式27图像编码数据编码图像的数字化及处理图片图形图像是真实物体的模型化、抽象化和线条化的表现方式。真实地再现了一个物体的原形位图矢量图由像素组成,可以用“画图”软件创建、数码相机获取等。由一组指令集合描述,可以用“Flash、CorelDRAW”等软件创建。位图与矢量图的区别:位图缩放以后会失真,矢量图缩放以后不会失真。(1)图像编码是指在满足一定保真度的条件下,对图像数据进行变换、编码和压缩,以较少比特数表示图像或图像中所包含的信息的技术。(2)位图,最小单位为光栅点(或称像素),也叫作点阵图(或像素图)。图像编码301111111100000110100001101111111110000001011000110111110010000001【例】在如图所示的黑白图像中,共有32×2个像素,如果将黑、白像素分别映射为1和0,就表示为11111111,00000110,10000110,11111111,10000001,01100011,01111100,10000001,这就是该黑白图像的二进制编码。通常图像编码采用16进制编码,因而图1-10的编码为“FF,06,86,FF,81,63,7C,81”。(1)、单色图像(黑白)单色图像中,一个像素点只需要一个二进制位(1bit)来记录,可以表示出两种颜色,黑像素用“0”表示,白像素用“1”表示。2=213、图像颜色图像的数字化及处理(2)、灰度图像每个像素用一个字节来表示,一字节可以表示256种不同的灰度。2==2568彩色图像即RGB模式:真彩色模式,以红绿蓝为基本颜色,每个分量由8位二进制数表示。可以用3个字节来表示,每个字节分别表示此像素中的红、绿、蓝成分。(3)、彩色图像图像的数字化及处理4、位图图像存储空间的计算公式是:水平像素*垂直像素*每个像素色彩所需位数/8(字节)思考:一幅800*600的黑白图像所占的空间?灰度图像呢?彩色图像呢?800*600*1/8(字节)800*600*8/8(字节)800*600*24/8(字节)数据编码下面表格以分辨率800×600的位图图像为例,计算各种类别位图图像的存储空间。位图图像类别总像素一个像素所占的位数总的位数(bit位)容量(B)黑白800×6001位(2^1=2)800×600×1800×600×1/8256级灰度800×6008位(2^8=256)800×600×8800×600×8/816色彩色800×6004位(2^4=16)800×600×4800×600×4/8256色彩色800×6008位(2^8=256)800×600×8800×600×8/824位真彩色800×60024位800×600×24800×600×24/8【理解】图像编码(3)位图文件所占用的空间,可按以下公式计算:文件的大小=文件头+信息头+颜色表项+图像分辨率×图像量化位数÷8其中,图像分辨率=图像x方向的像素数×图像y方向的像素数。因为文件头14个字节,位图信息头40个字节,颜色表项占4个字节,占用空间相对较小,很多时候计算的位图大小仅仅指的是数据文件的大小。位图数据文件大小=图像分辨率×图像量化位数÷81.2.2编码的基本方式【例】有一幅24位的位图图像,像素为1024×800。其数据文件的大小为位图数据文件大小?若将上述图像另存为256色位图图像,则文件大小为多大?1.2.2编码的基本方式361024×800×24÷8=2.34MB因为256=28,所以位图数据文件大小1024×800×8÷8=0.78MB1.图像尺寸为90×72像素,颜色深度为1,计算该图像所占的存储容量。解析:图像所占的存储容量=90×72×1/8=810B练一练:2.图像尺寸为90×72像素,颜色深度为24位,计算该图像所占的存储容量。解析:图像所占的存储容量=90×72×24/8=19440B19440/1024≈19KB声音编码数据编码(1)采样。采样就是把输入的模拟信号按适当的时间间隔得到各个时刻的样本值,使其转换为时间上离散、幅度上连续的脉冲信号。常用的采样频率有三种:44.1kHz、22.05kHz和11.025kHz。根据奈奎斯特(HarryNyquist,物理学家,1889—1976)采样定理,如果以一定时间间隔对某个信号f(t)进行采样,并且采样频率高于该信号最高频率的两倍,则采样值包含了原信号的全部信息。声音编码【理解】声音编码(2)量化。量化是把样值信号的无限多个可能的取值,近似地用有限个数的数值来表示。首先是将采样信号幅度划分为若干量化等级(国标声音量化等级分为256个,即28个),然后将采样后的信号幅度与所划分的各个量化等级进行比较,向下取最接近的量化等级的数值。1.2.2编码的基本方式(3)编码。编码是将量化后的采样值用二进制数码表示,并转换为由二进制编码0和1组成的数字信号。模拟