CS,ZJU2020/1/28Overview数制数、码编码与文本多媒体数据逻辑基础概述计算就需要数计算机中的数的表示是一个基础性的问题表示各种现实世界对象的“数据”,So数的表示也延伸到了数据的表示不同应用需要的数据类型有不同计算表示实体对象统一的数据表示方法基本形态是二进制2.2数制NumberSystem“计数(或记数)体制”多位数中每一位的构成方法以及实现从低位到高位的进位规则,也叫做进制数学家们研究数制的规则和规律计算机科学中将数制规则和规律通过电路实现常用进制二、十、八、十六数制常用进制R进制R个数码,数码从0到R-1数:每位数码和该位的权系数的乘积权系数也叫做幂次或叫做权重(PowerWeight)逢R进1计数规则十进制DecimalSystem0~9,逢十进一二进制BinarySystem位(比特,bit)是计算机处理的最小单位0和1两个数码,被组合成各种序列以适应计算机的运算和处理的数据类型选择二进制的一个最简单也是最实际的理由是它容易被物理器件实现二进制起源于中国——八卦多项式表示一个二进制数:101011012=1×27+0×26+1×25+0×24+1×23+1×22+0×21+1×20八进制and十六进制OctalSystem八个数码:0、1、2、3、4、5、6、78=23一位八进制对应于三位二进制HexadecimalSystem16个数码:09,A、B、C、D、E、F字节(Byte,8个二进制位)=两位十六进制16=24:4位二进制和1位十六进制对应二进制的基本运算二进制加法0+0=00+1=11+0=11+1=10HereCarry二进制乘法00=001=010=011=1二进制和十进制转换1.二进制转换为十进制被转换的二进制数按幂次展开,然后相加1101.012=123+122+021+120+012-1+12-2=8+4+0+1+0+0.25=13.25102.十进制转换为二进制整数小数十进制整数转换为二进制数17310=101011012十进制小数转换为二进制,2二进制与八进制转换二进制与八进制存在对应的幂次关系BinaryOctol257.0648=010101111.0001101002二进制、十六进数转换16=2410110101.001012=0B5.2816SeeTable2-12.4计算机中的数正负:符号位,0表示正数,1表示负数+101101011-101111011真值机器数运算的数定义:原码(OriginalCode)反码(One’sComplement)补码(Two’sComplement)不同的运算使用不同的码和不同的运算方法设计运算器原码原码即上述的机器数——n位二进制数,最高位被设置为符号位,其后的n-1位表示真值。原码的特点简单直观用原码可以比较方便地进行乘法运算:尾数相乘符号位简单相加法就可以得到乘积反码反码的定义是:一个正数的反码就是它的机器数,负数的反码其最高位(符号位)为1,其余各位按位求反例如,+1010010反码为01010010-1010010反码为10101101反码和原数相加:结果为所有位都是1对1互补专业术语:One’sComplement补码补码的定义是:正数的补码等于它的原码,负数的补码等于它的反码加1(最低位加1,进位不改变符号位)例如,+1010010的补码为01010010-1010010的补码为10101110补码一个有意思的特性是:补码的补码将还原为原码专业术语:对2求补(Two’sComplement)补码用于减法运算定点数和浮点数数的表示——两种格式:定点数和浮点数计算机中保存数二进制固定长度定点数:16位或32位小数点固定在某一个位置定点纯小数、定点纯整数浮点数——小数点位置是浮动的定点数定点纯小数格式定点纯整数格式浮点数思想来源于科学计数法(指数)容许的数值范围大,处理硬件复杂浮点数分阶码和尾数阶码:小数点位置——带符号的整数——类似于数学中数的指数部分尾数表示数的有效数值:纯整数或纯小数2.5编码和文本数还有另外一种功用:码(Code)编码的目的是为了便于标记特定的对象设计编码时需要按照一定的规则——“码制(CodeSystem)”重要概念位模式常用编码:ASCII、汉字编码、多媒体数据位模式用于计算的数:用二进制位的多位组合表示定点数、浮点数更多的数据类型,就需要有更多的二进制位的组合规则——位模式bitpattern用0和1组成的二进制位序列及其规则是一种数据表示方法要由计算机程序去理解它们位模式要求:用户、程序设计者按某种规则形成、存储和处理数据位模式的二进制位序列长度取决于被编码对象的数量文本和文档文本(Text)——编码来表示文本中的每一个符号包括字母、标点,都以一个唯一的二进制位序列表示在计算机中,文本就是位模式的二进制数据长串基础的文本编码就是ASCIIAmericanStandardCodeforInformationInterchange基于English文本编码是计算机进行数据交换的基础ASCII码ANSI制定,后为ISO646适用于英文,两种形式:7位码和8位码7位二进制ASCII码单字节字符编码方案,基本的文本数据8位码是扩展ASCII码,SeeAppendixAUnicode编码通用多文种字符集表示几乎世界上所有书写语言的字符编码标准——统一码、单一码、万国码可支持超过百万个字符的编码Unicode编码国际标准ISO10646ISO采用的是32位模式用于世界范围各种语言文字的文本形式的字符集,也收集了汉字汉字编码汉字编码的目的是为了计算机能够处理、显示、打印、交换汉字字符国家汉字编码标准GB2312-1980简化汉字6763个,7445个字符港澳台地区使用繁体汉字BIG5码1995年的GBK扩展汉字编码标准GB2312-1980的扩展收录了2.1万多个汉字GBK支持ISO10646中的全部中、日、韩汉字2001年GB18030——GBK的升级160万码位,目前汉字约为2.6万个2.6多媒体数据多媒体文本,图形、音频、视频等多种数据表现形式,并使之在逻辑上建立联系今天计算机和网络都支持多媒体数据处理相比文本……图形和图像图形(Graphics)——几何线条、几何符号等形式表示物体的轮廓在数据表达上图形和图像也被认为是同类例如,Windows的“画笔”程序,既可以画几何图形,也可以对图形着色使之成为图像(Picture,Image)两种技术:位图和矢量图位图技术微软公司提出的又称光栅图(RasterGraphics)使用像素(Pixel)阵列,每一个像素是一个点(Dot),点数据的大小取决于分辨率位模式有1、4、8、16、24及32位等灰度图像——每一个像素需要更多的二进制位彩色图形、图像——RGB矢量图技术任何图像、图形可以分解为曲线和直线的组合直线和曲线度都可以使用数学公式表示直线、曲线公式的组合作为图形数据存储起来,需要显示或者打印图形图像数据时画图的公式被重新执行并根据给定的大小画出(重现)图形图像矢量图看上去更加平滑,不会产生纹波误差音频音频(Audio)包含了声音(Voice)和音乐(Music)计算机音频就是研究在计算机中表示和处理声音与音乐数据,目前没有“数字音频标准”视频视频(Video)是图像的动态过程一幅幅(Frame)图像数据连续播放,就成为了动态图像也是一种位模式数据压缩处理后存储,播放时需要解压MPEG制定的一系列视频编码和压缩标准音频/视频的MPEG-1到MPEG-4MPEG是ISO指定的标准研究组织,它的最新工作是MPEG-212.7逻辑运算和门电路用数学的方法研究关于推理、证明等问题的学科数理逻辑,也叫做符号逻辑英国数学家布尔——建立了布尔代数(逻辑代数)——计算机重要的科学基础逻辑关系可以被解释为因果关系“因”是条件条件之间的关系用逻辑连接词进行组合根据不同的条件得到“结果”逻辑运算对应的实现电路,叫做门电路基本逻辑(运算)关系与(AND),或(OR),非(NOT)逻辑关系与只有决定结果的条件全部满足,结果才成立,这种逻辑关系叫做逻辑与表示AANDBA●BAB把变量和逻辑关系的取值列表,就得出了真值表(TrueTable)ABAB000010100111逻辑或决定结果的条件中只要任何一个满足,结果就成立。这种逻辑关系叫做逻辑或表示AORBA+B表2-3逻辑或真值表ABA+B000011101111逻辑非。最简单的描述就是结果对条件的“否定”表示NotA逻辑非的真值表A1001AA逻辑代数通过代数学的方法研究逻辑关系,通过变换、简化或组合等方法进行逻辑设计逻辑表达式A+A·BA+AB逻辑函数F=f(A,B,C,…)AB=A+B反演定律A+BC=(A+B)(A+C)分配律A+AB=A+B吸收律门电路实现基本逻辑关系的电路是逻辑电路中的单元电路——Gate基本的门电路有:与门或门非门异或门门电路的基本特点RbRcGNDVccVinVoutT5V0V5V0V图2.5晶体管非门电路基本门电路用基本门电路可以组合成多种复合门电路ABFAFABF(a)与门F=AB(b)或门F=A+B(c)非门F=A与非门ABF图2.9与非门ABF001011101110图2.10或非门AFBABF001010100110或非门异或门ABF图2.10异或门BABABAFABF2.8逻辑设计基础逻辑设计——根据问题,由真值表得到逻辑表达式根据逻辑定律进行必要的化简、变换,设计出最优的逻辑表达式用逻辑电路实现逻辑分析与设计相反由电路得到功能设计加法器用逻辑电路实现加法运算的电路叫做加法器(Adder)设A、B分别为一位二进制数S为A与B之和,C为A加B产生的进位加法的真值表表达式ABSC0000011010101101BABASABCABSC半加器/全加器半加器只考虑加数和被加数之间的加法运算,并产生了向高位的进位——没有考虑可能来自低位的进位,所以它并没有完成一位二进制的全部运算,半加器的意思是它只完成了一半的加法运算全加器不但要考虑本位产生的进位,还要考虑来自低位的进位全加器输入输出Ci-1AiBiSiCi00000001100101001101100101010111001111111iii1iii1iii1iiiiCBACBACBACBAS全加器电路1iiiiCBASiiiiiiiCACBBACAiBiCi-1SiCiS3S0S1S2A3B3A2B2A1B1A0B0C3四位加法器电路逻辑示意图存储单元电路图2-14门电路组成存储单元原理示意图集成电路ICIC按电路内门电路的数目来划分其规模小规模IC(SSIC,SmallScaleIC)大约有10个门电路。超过100个门电路——中规模集成电路(MSIC,MiddleScaleIC)大规模IC(LSIC,LargeScaleIC)集成的门电路要超过1000个以上超大规模IC(VLSIC,VeryLargeScaleIC)超大规模集成电路的集成度已经超过了千万思考题数据表示也是一个社会问题使用编码对各种对象进行标记,但必定会产生某些有意无意的歪曲。例如,对某一社会问题进行问卷调查,而问卷中的答案使用等级,给每个等级赋值进行统计分析,你认为这种“量化”是合适的吗?为什么?下音频数据格式有多少种,各有什么特点数据压缩使用的技术