第五章信息资源管理的技术•5.1信息资源采集技术•5.2信息资源压缩技术•5.3信息资源存储技术•5.4信息资源共享技术5.1信息资源采集技术•5.1.1文本生成–1、键盘录入•智能ABC、紫光、拼音加加、五笔字型–2、语音识别•语音特征提取•模式匹配(识别算法)•声学模型•语言模型清华大学电子工程系语音技术课题组,研发的非特定人汉语识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。–3、手写输入•手写输入方法,是把要输入的汉字写在一块叫书写板的设备上。•汉字识别的方法基本上分为结构识别、统计识别方法等几大类。•联机手写识别系统采用的是结构识别方法。优点是区分相似字的能力强,缺点是抗干扰能力差。•汉王联机手写识别系统,目前在中国的嵌入式中文手写技术市场上汉王占有90%以上的市场份额。–4、OCR识别•OCR是OpticalCharacterRecognition的简称,指光学字符识别技术。•识别流程:•常用软件:尚书六号、清华紫光OCR辨识系统、蒙恬认识王、丹青中英文文件辨识系统•“尚书六号”使用步骤:•扫描图像文件•打开尚书六号读取扫描好的图像文件•被识别图片的预处理•开始进行识别•识别校对完成后,进行保存•5.1.2图像扫描–图像扫描常用设备有扫描仪、图像采集卡、数码相机等。•1扫描仪•1)、什么是扫描仪•扫描仪是指把图像或文字用扫描方式数字化后输入计算机的一种设备。•2)、扫描仪的种类•a.平板式扫描仪它是由步进电机带动扫描头对图片进行自动扫描。其特点是扫描精度较高、使用方便、成像稳定,它适用于图稿幅面不太大,精度要求较高的场合。•b.手持式扫描仪它是以手动的方式推动扫描仪对图片进行扫描。其特点是体积小、携带方便、价格便宜,但由于手推进速度均匀性问题,容易造成图像失真。它适用于图稿幅面小、精度要求不太高的场合。•c.滚筒式扫描仪它是采用扫描头固定、滚动式走纸机构移动图纸而自动完成扫描。它适用于大型工程图的输入,例如A0、A1大幅面图稿输入。•3)、扫描仪的结构–扫描仪主要由上盖、原稿台、光学成像部分、光电转换部分、机械传动部分组成。•4)、扫描仪的工作原理•将光线照射在图片上,产生反射光或透射光,通过CCD电荷耦合器件将光线亮度的强弱以及色彩信号转换成模拟电信号,再经A/D转换成数字图像信号。•5)、CCD扫描仪与CIS扫描仪的比较CCD(光电耦合器)CIS(接触式图像传感器)光学系统部件复杂,成本较高。冷阴极管做光源,需要预热1分钟左右才能稳定发光。部件模块化,结构、原理和光路都极为简单;LED发光二极管做光源,光色及均匀度上较差,色域较窄,光源的寿命较短。颜色还原通过一系列透镜、反射镜成像,会产生色彩偏差和光学像差,需要软件进行色彩校正。直接获取图像,能获得最接近原稿的图像效果。成像质量镜头成像,扫描效果清晰。景深长,可以扫描实物。扫描精度较低,成像易模糊和散焦。•5.1.3音频采集和生成–计算机必须有相应的输入输出设备才能进行声音信号的处理。–1、声卡的工作原理–2、声卡的性能指标•1).采样频率它是指单位时间内采样的次数。常用的采样频率为:11.025kHz(语音效果)22.05kHz(音乐效果)44.1kHz(高保真效果)•2).量化位数它是指每一个采样点用几位二进制数来表示。常用的量化位数有16、32、64位。量化位数越多,音质就越好。•3).声道数–声道数分为单声道和双声道(立体声)。–声音文件字节数=录音时间×(采样频率×量化位数×声道数)/8–例如:一个语音文件,其采样频率为11.025kHz,量化位数为16,单声道,则一分钟的语音数据量为:60*(11.025*103*16*1)/8=1.26MB–3、语音合成•语音合成技术是让计算机能够产生高清晰度、高自然度的连续语音。•语音合成有二种方式:–再生一个预先存入的语音信号;–采用数字信号处理的方法,模拟声门发声。•5.1.4视频采集–视频卡是基于PC机的一种多媒体视频信号处理平台,它汇集了视频源、音频源的信号,经过捕获、压缩、存储、编辑和特技、输出处理等,可产生非常漂亮的画面。–视频卡的功能还包括图像的放大修整、像素显示调整、捕捉特定画面、若干视频源图像混合等。–视频卡的种类很多•1.视频采集卡(视频捕捉卡)•2.视频转换卡(PC-TV或VGA-TV,TV-VGA)•3.视频叠加卡(卡拉OK歌词的叠加)•4.MPEG解压缩卡(电影回放卡)•5.视频压缩卡–视频采集卡共分为两大类:一类是模拟采集卡,另一类是数字采集卡。–数字采集卡均采用了IEEE1394作为标准的数字接口.•带有硬件CODEC的1394编辑卡,特点是:生成的速度快、编辑质量高,功能也比较强大,但价格昂贵。•软件CODEC,特点是:价格较低,但由于是用软件实现编解码,所以处理速度相对来讲要慢得多,对计算机的配置要求也比较高;•5.1.5自动识别技术–自动识别技术就是应用一定的识别装置,通过被识别物品和识别装置之间的接近活动,自动地获取被识别物品的相关信息,并提供给后台的计算机处理系统来完成相关后续处理的一种技术。–自动识别技术包括:条码技术、磁条磁卡技术、IC卡技术、光学字符识别、射频技术、声音识别技术、视觉识别技术等。•1、自动识别技术的分类–自动识别系统根据识别对象的特征可以分为两大类,分别是数据采集技术和特征提取技术。–数据采集技术的基本特征是需要被识别物体具有特定的识别特征载体。–特征提取技术则根据被识别物体的本身的行为特征来完成数据的自动采集。–2、条码技术•条码是由一组规则排列的条、空构成不同的图形符号。条码分为一维条码、二维条码。•EAN条码是国际通用符号体系,它们是一种定长、无含义的条码,主要用于商品标识。•EAN128条码是一种连续型、非定长有含义的高密度代码,用以表示生产日期、批号、数量、规格、保质期、收货地等更多的商品信息。•PDF417条码是一种高密度、高信息含量的条码,其特点为:信息容量大、编码应用范围广、保密防伪性能好、译码可靠性高、条码符号的形状可变。•条码成本较低、适于大量需求且数据不必更改的场合。–3、光学字符识别OCR–4、磁条(卡)技术•磁条技术的优点是数据可读写,数据存储量能满足大多数需求,便于使用,成本低廉。•很容易磨损,安全性较低。•在很多领域得到了广泛应用,如信用卡、银行ATM卡等。–5、IC卡识别技术•IC(IntegratedCard)卡,将可编程设置的IC芯片放于卡片中。•IC卡从嵌装的芯片划分可成两大类,存储器卡和智能卡。•按照数据读写方式,IC卡又可分为接触式IC卡和非接触式IC卡两类。•IC卡(接触式)和磁卡比较有以下特点:–安全性高;–存储容量大;–防磁,抗干扰能力强,可靠性比磁卡高;–使用寿命长–价格稍高些;–由于它的触点暴露在外面,有可能因人为的原因或静电损坏。–6、声音识别技术–7、视觉识别–8、射频识别技术(RFID)•射频技术是利用无线电波来进行通讯的一种自动识别技术。•射频标签最大的优点就在于非接触,缺点是标签成本相对较高。•RFID广泛应用于门禁安防系统、物流系统、生产线自动化、收费站等要求非接触数据采集和交换的场合。