CIDP_13 公共文化资源的采集

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第13讲公共文化信息资源的采集时间:1月11日14:00~16:00地点:A306文化产业管理专业《文化信息资源开发规划》课程内容文化信息资源的来源文化信息资源采集的原则文化信息资源采集的程序文化信息资源采集的方法文化信息资源采集的技术1.文化信息资源的来源信息采集:是指根据特定的目的和要求将分散蕴涵在不同时空域的有关信息采掘和集聚起来的过程。是指人们为了某种需要,采用科学的方法,根据特定的条件对分散在不同信息源的所需信息进行收集、获取的过程。它是信息分析处理的先决条件与首要环节。1.文化信息资源采集概述信息采集很多时候被称为“数据采集”,尤其是指原始信息采集采集二次或三次信息时,经常就直接称为“信息采集”你能区分他们的异同吗?数据采集信息采集1.文化信息资源的来源下面的描述是“信息采集”还是“数据采集”??第六次人口普查09年本科毕业生就业情况搜集2005年以来北京林业大学师生发表的学术论文在网上查找招聘职位测量实习记录的数据记录实验室的实验结果1.文化信息资源的来源信息源:人们获取信息的来源。个人信息源实物信息源文献信息源数据库信息源组织机构信息源1.文化信息资源的来源个人信息源的概念也称口头信息源,即通过人与人间的口头语言交流来获取信息的方式。人既是信息的凝聚点,也是信息的发射源个人信息源的特点是(1)及时性(2)新颖性(3)强化感知性(4)主观随意性(5)瞬时性1.文化信息资源的来源实物信息源的概念实物信息源主要是指各种无机物(如水、空气、土壤、岩石、矿石等)样品,有机物(如动植物等)化石或标本,文物和人类劳动成果的样本,各类产品及服务市场,实验室以及其他有可能出现新的信息“火花”的场所。实物信息源的特点(1)直观性(2)真实性(3)隐蔽性(潜在在实物中)(4)零散性(时空分布广)1.文化信息资源的来源文献信息源的概念指用一定的记录手段将系统化的信息内容储存在纸张、胶片、磁带、磁盘和光盘等物质载体上而形成的一类信息源。如:图书、期刊杂志、影像资料、微缩胶卷印刷型文献、缩微型文献、声像型文献、机读型文献存储信息传播信息文献信息源的特点(1)系统性(2)稳定性(3)易用性(4)可控性(控制:数量、质量、流量)(5)时滞性(如:论文发表时间、图书的出版周期)1.文化信息资源的来源数据库信息源的概念以数据库方式提供信息服务的一类信息源。数据库就是在一定的计算机软硬件技术支持下,按照一定方式和结构组织起来的,具有最小冗余度和较高独立性的大量相关数据的集合。把大量的数据组织成数据库,一方面提高了用户的信息检索效率,另一方面也有利于实现信息资源共享。如:文字数据库、数值数据库、声像数据库和多媒体数据库等数据库信息源的特点(1)多用性(为用户提供尽可能多的检索途径)(2)动态管理性(便于扩充修改,更新速度快)(3)技术依赖性(依赖于计算机的运算能力和存储能力)1.文化信息资源的来源组织机构信息源的概念各级各类组织机构主要是通过内外信息交换来发挥其控制功能,实现组织目标的一类信息源。如:国家统计局信息组织机构信息源的特点(1)权威性(如:研究开发信息、生产经营信息、质量监督管理信息)(2)垄断性(房管局的房屋拆迁信息、物价局的物价变更信息)2.文化信息资源采集的原则目的性原则系统性原则预见性原则科学性原则及时性原则计划性原则2.文化信息资源采集的原则信息采集原则--目的性原则信息采集要有针对性根据需求有目的的采集信息例如:人口普查质量检查安全管理科学研究……想想你亲历的信息采集有何目的2.文化信息资源采集的原则信息采集原则--系统性原则零散的信息不能反映事实真相,系统性是提高信息利用价值的保证2.文化信息资源采集的原则信息采集原则--科学性原则信息采集方法要有科学性采集的类型、数量、质量等都要有科学依据问题:你在研究中进行的信息采集科学吗??反例:小王跟朋友说他竞选班长,得到了97%的支持票,其中男生中的60%给他投了支持票,女生中的37%支持选票。。。2.文化信息资源采集的原则信息采集原则--及时性原则信息具有时效性其价值的大小与提供信息的时间密切相关信息采集不及时或采集过时信息都会造成时间和资金的浪费2.文化信息资源采集的原则信息采集原则--计划性原则信息采集计划的划分时间计划内容计划计划:采集信息的内容范围,精度,数量,费用等要仔细考虑“采集什么”的问题3.文化信息资源采集的程序3.文化信息资源采集的程序需求分析确定信息服务对象确定信息资源采集的内容确定信息资源采集的范围和量其他因素(信息资源的语种要求、著者要求、查全率、查准率)3.文化信息资源采集的程序选择信息资源采集系统信息资源采集系统是指人们为了搜集、处理、储藏和提供信息服务而建立的人工系统。广义:信息检索系统、各种信息机构、信息系统、图书期刊根据需求分析选择合适的信息源现场调查、会议讨论、信息检索(检索工具的选择)3.文化信息资源采集的程序确定采集途径和策略根据信息资源采集需求不同,采用不同的采集途径和策略根据需求确定该项工作有哪些特征,这些特征决定该从哪些途径入手进行采集。信息检索(主题、分类、著者、题名)采集策略,具体执行方案(计算机检索中采集策略为构造检索式)3.文化信息资源采集的程序4、采集实施和结果评价采集实施过程中要注意监控,采集实施中所得到的初步结果要及时进行评价。作为修改和调整依据,不断对采集途径、策略以及采集系统进行调整,直至得到满意的结果。5、其他后续工作数据的整理,原始文献的获取,检索报告的编写4.文化信息资源采集的方法采购采购是获取和积累有价值的信息的重要方式,特别是许多公开出版的书刊和发行的数据库,必须根据国内外公开发行的各种指南来购买。采购是一种经常性的、稳定的、系统的采集和获取信息资源的有效方式。包括订购、现购、邮购、委托代购等具体方式,可以根据采购规模和自己的需要进行选择。4.文化信息资源采集的方法调查访谈现场调查访问发放问卷样品收集调查收集信息资源不如其他信息资源采集方法那样系统、连续,数量也不够多,但其速度快、质量高、准确性好、针对性强,是获取信息的有效方法,尤其是获得非文献信息资源的最有效的方法。4.文化信息资源采集的方法交换利用本系统所拥有的信息资源与其他单位进行交换,互相调剂、互相补充,扩大信息来源。交换的信息资源多属于内部资料、非卖品,不能通过采购或其他方式获得。直接交换资料,不通过其他中间环节,有利于迅速及时地获取信息。4.文化信息资源采集的方法咨询向熟悉信息咨询分布的专家、熟悉各类检索工具的专家和学科专业方面的专家咨询,在他们的指导或帮助下采集信息资源。4.文化信息资源采集的方法索取对于尚未发表的信息资源或未通过正式渠道流通的信息资源,以及已经发表或公开流通但不够详细、完备和全面的信息资源,根据需要与可能,可以通过通信联系或直接派人联系取得,这种方法称之为索取。4.文化信息资源采集的方法检索检索是以手工或计算机方式从各类不同的数据库和信息系统中查寻所需要的信息。手工检索主要通过各类检索工具获得信息资源的线索,如果需要原始信息,还要进行二次检索。计算机检索不仅可以获得信息资源线索,还能直接获得原始信息。5.文化信息资源采集的技术信息获取技术现代的信息不单是文字、数值、符号、图像、声音等,而是各种形式的媒体。文本生成文本输入到计算机分为人工和自动两种输入方法光学字符识别技术(OCR)图形图像图形即矢量图,描述点、线、面等几何图形的大小、形状、位置及其他属性的指令集合。常用的格式有DXF、PIF、SLD、DRW等。图像在计算机中用数字描述像素点、强度和颜色。常用格式为BMP、GIF、JPEG、JPG等。5.文化信息资源采集的技术动画和视频利用人眼的视觉暂留原理,将一系列顺序排列的静态画面连续播放,从而产生动态效果,其中的每个画面就是视频文件的一帧。Flash是美国Macromedia公司出品的矢量图形编辑和动画创作的专业软件,主要应用于网页设计和多媒体创作。其文件扩展名为:.fla.swf等。视频文件是通过视频采集卡把模拟电视信号进行采样、量化、转换而成的数字图像文件。常用的视频格式有DVD、Quicktime、AVI等。音频音频质量主要体现在音调、音强、音色上,常用格式有WAV、MP3、MP4、WMA、MIDI等。5.文化信息资源采集的技术文本挖掘技术文本挖掘技术是指从大量文本数据中发现和提取隐含模式和知识,它涵盖了文本分析、模式识别、统计学、数据库技术、数据可视化、机器学习、人工智能等多领域技术。是数据挖掘领域的一个分支。数据挖掘的对象以数据库中的结构化数据为主,并利用关系表等存储结构来发现知识,处理过程如图示:文本数据源文本特征库预处理文本挖掘分析数据集合客户端可视化技术交互技术5.文化信息资源采集的技术自动分类技术自动聚类:从待分类对象中提取特征,根据一定的规则将具有相同或相近特征的对象归为一类。自动归类:从待分类对象中提取特征,通过与事先定义好的各种类别具有的共同特征进行分析,再将分类对象划归为特征最接近的一类并赋予相应的分类标识。常用算法:KNN算法即K最邻近算法教学总结笔记整理Q&A感谢您的关注!请您多多指导!

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功