文件多媒体信息的数字化原理目前计算机可以处理气味?为什么?生活中我们接触到的许多信息都是非数字化的,如报刊、书籍、照片等。我们利用多媒体技术处理信息,首先是要将信息数字化,只有用0和1表示的信息才能被计算机编码、存储和处理,进而发挥出数字化处理和传输信息的优势。多媒体技术所涉及的媒体信息包括文本图形、图像声音、视频和动画等他们都有自己的数字化表示和存储方式,是多媒体技术的基础。文本英文(大、小写)数字符号中文:如何对文本进行编码?约52+10+32=94ASCII码用7位二进制代码来表示,7位二进制码共有27=128种不同的组合,可以表示128个字符。返回ASCII值控制字符ASCII值控制字符0000000NUT(标题开始)1100101A0000001SOH(正文开始)1100110B0000010ETX(正文结束)kkkkkkkkkkkC0000011…..1101000D….…..…..….10010000…10010011…=10010102..10010113…..10011004100110151001110610011117….….国标码是1981年由国家标准局颁布的《信息交换用汉字编码字符集--基本集》的简称。代号是GB2312-1980。共收录了6763个汉字(其中一级汉字3755个按汉语拼音字母顺序排列,二级汉字3008个按部首笔划顺序排列,非汉字符号682个)。GB18030-2000:收录了2万多汉字GB2312-80规定:所有的国标码汉字及符号组成一个94×94的方阵。在此方阵中,每一行称为一个“区”,每一列称为一个“位”。这个方阵实际上组成一个有94个区(编号由01到94),每个区有94个位(编号由01到94)的汉字字符集。一个汉字所在的区号和位号的组合就构成了该汉字的“区位码”。其中,高两位为区号,低两位为位号。一级汉字16-55区二级汉字56-87区三级汉字1-9区空闲未用10-15区0102030405060708。94啊阿01020304050607080910。。。。。。94区码位码、。·ˉˇ¨〃々-~‖ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ⒈⒉⒊!“#¥%&'()*+区号:01【各类符号】0123456789101112131415161718190100、。·ˉˇ¨〃々-~‖…''〔〕0120〈〉《》「」『』〖〗【】±×÷∶∧∨∑∏0140∪∩∈∷√⊥∥∠⌒⊙∫∮≡≌≈∽∝≠≮≯0160≤≥∞∵∴♂♀°′″℃$¤¢£‰§№☆★0180○●◎◇◆□■△▲※→←↑↓〓区号:02【各类数字】0123456789101112131415161718190200ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ⒈⒉⒊0220⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛⑴⑵⑶0240⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇①②③0260④⑤⑥⑦⑧⑨⑩一二三四五六七八九十0280ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ区号:03【符号、字母】0123456789101112131415161718190300!"#¥%&'()*+,-./01230320456789:;<=>?@ABCDEFG0340HIJKLMNOPQRSTUVWXYZ[0360\]^_`abcdefghijklmno0380pqrstuvwxyz{|} ̄区号:06【罗马字母】0123456789101112131415161718190600ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤ0620ΥΦΧΨΩαβγδεζη0640θικλμνξοπρστυφχψω06600680区号:08【汉语拼音】0123456789101112131415161718190800āáǎàēéěèīíǐìōóǒòūúǔ0820ùǖǘǚǜüêㄅㄆㄇ0840ㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒㄓㄔㄕㄖㄗㄘㄙㄚㄛ0860ㄜㄝㄞㄟㄠㄡㄢㄣㄤㄥㄦㄧㄨㄩ0880区号:09【制表字符】0123456789101112131415161718190900─━│┃┄┅┆┈┉┉┊┋┌┍┎┏0920┐┑┒┓└┕┖┗┘┙┚┛├┝┞┟┠┡┢┣0940┤┥┦┧┨┩┪┫┬┭┮┯┰┱┲┳┴┵┶┷0960┸┹┺┻┼┽┾┿╀╁┃╃╄╅╆╇╈╉╊╋汉字区位码二进制国标码机内码文463600101110001001004E44HC(位于46区36位)46360010111000100100(二进制)4E44(十六进制)区位码转换成国标码(区码+100000位码+100000)0010111000100100(二进制)4E44(十六进制)区位码转换成机内码:二进制区码+10100000位码+101000001100111011000100(机内码,二进制)CEC4H(十六进制)一、文本的数字化输入内部处理输出如通过键盘进行英文输入、汉字输入法编码输入机内码(二进制编码)如汉字字模转换表1转换表2英文机内码(ASCII码)a1000001机内码字模1000001a五笔码机内码ro0011011000111001机内码字模0011011000111001人数字机内码200000010机内码字模00000102拼音码机内码ren10011011000111001机内码字模0011011000111001人汉字处理进程的不同,采用的编码也不同输入时采用输入码,存储、处理汉字时采用机内码,显示(输出)汉字时采用字型码。文本英文(大、小写)数字ASCII码—机内码符号(美国标准信息交换码)中文:GB2312-1980GB18030-2000小结:文本数字化的本质:用二进制给这些文字编码