信息组织与分类编目

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

信息组织与分类编目南京农业大学信息管理系刘磊llxx_2000@263.net;025-84396276(H)SNS:人人网;QQ:2297370769提纲1、互联网的发展趋势2、网络环境下的信息组织与分类编目3、信息组织与分类编目的关系4、信息组织的基本任务1、互联网的发展趋势(1)发展速度(主机、用户、网站、带宽)1)上网计算机数比较截至2007年底,我国上网计算机总数己达7800万台,与1997年10月相比,增长了260倍;2009年以后无总数统计,呈现出上网设备多元化(台式机、笔记本、手机),按网民数推算上网电脑应超过1.5亿台。2)上网用户人数比较截至2007年底,我国的互联网用户已经达到了2亿1千万,居世界第二位(2008年6月居世界第一)。与1997年10月相比,增长了300多倍,占中国人口总数的16%。2010年普及率达34.3%,四项指标增长比较分析3)年底,我国个,与1997年10月相比,倍。2010年达1270多倍。4)国际出口带宽总容量比较截至2007年底,我国国际出口带宽的总容量为368,927M,是1997年第一次调查结果25.4M的14757倍,2010年达43956倍。上述指标中国际出口带宽增速最快。问题:为什么出口带宽增长速度高于其他指标?四项指标增长比较分析(续)1)社会原因——用户信息需求(市场导向)。2)技术原因——IT四定律(摩尔定律、贝尔定律、吉尔德定律和麦特卡尔夫定律)。3)经济原因——信息经济(电子商务、网络经济、数字经济)在IT四定律推动下兴起。(2)互联网迅猛发展的原因2003年6月Google搜索的网页为30亿个,而2004年11月,Google副总裁比尔·考兰宣布,Google数据库中网页已经超过80亿个;自2003年开始:中国网页基本保持翻番增长,2003年网页3亿个、2008年161亿个、2009年336亿个,比2008年增长了1倍多,比2003年增长了100倍多。2010年11月,新兴搜索引擎BlekkoCEO里奇·斯科伦塔表示,由于网页总量已经突破1万亿,“垃圾信息也呈现加速增长态势”。他还表示:“我们将借助大规模的人工手段清理这类内容。”从而推广“受信赖”的内容。(3)网络环境下信息资源发展状况1)信息数量庞大且增长迅速2)信息内容丰富网络信息资源内容极为丰富,覆盖面广,涵盖了各学科各领域,且种类繁多,几乎无所不包。网络信息没有统一的管理机构和发布标准,且变化、更迭、新生、消亡等随时发生,质量良莠不齐,重复严重(我国重复网页比例达到25%左右),难以控制。3)信息质量差异增大网络以超文本、超媒体、集成式地提供信息,除文本信息外,还有图表、图形、图象、声音、动画、视频等。提供了丰富的学习、娱乐功能。4)信息形式多样5)信息交流方式多样•现代社会信息高度的分散无序性与人们利用信息的高度选择性形成了尖锐矛盾,信息组织通过人工和机器干预,使信息有序增值,形成信息资源,进而提供有效的利用(如搜索引擎谷歌和百度的发展、新兴搜索引擎Blekko对谷歌的挑战,又如雅虎用分类目录展开网络信息、图书馆为馆藏图书编制机读目录供用户查询、再如中国期刊网中的作者、关键词各种索引等)。•从这一角度看,信息组织可以说是信息管理的基本环节,是信息资源开发利用的基础,同时也是信息管理学科研究的核心内容。2、网络环境下的信息组织与分类编目(1)网络环境下信息组织的必要性随着互联网的普及和升级(Web1.0-Web2.0),数字文本复制的便利和自由发表的可能性,使得信息数量急剧增加。但社会信息量的增长并不意味着用户获取信息的增长,恰恰相反,无序的信息不仅无助于信息的使用,反而会加剧信息增长与使用的矛盾。人们生动地称这种情况是“信息超载,知识缺乏”。越来越多的人认识到,“原始信息本身并不能产生价值”,只有将其有效的组织,按特定的需要集中和揭示,才能产生价值。要有效开发利用信息资源,必须采用相应的方法加以控制和处理,信息组织是关键措施之一。(1)网络环境下信息组织的必要性(续)(2)信息组织的概念与目的1)概念:信息组织亦称为信息资源组织,它是根据信息检索的需要,以文本及各种类型的信息源为对象,通过对其内容、特征等的分析,选择,标引,处理(方法),使其成为有序化集合的活动。2)目的:建立信息资源收藏系统和检索工具,方便人们对信息资源的开发利用。(3)信息载体(媒体)对信息组织的意义信息交流的方式(媒体)有口头方式,印刷方式,数字方式;以记录方式(硬载体依托,包括印刷型的纸张和数字型的硬盘、光盘)进行交流,有助于克服口语交流局限,便于进行信息的组织。(4)信息源与文献的关系信息源或信息体通常指一切记录形式存在的信息载体,只是更侧重于新型媒体形式的强调。因此广义上,文献与信息源、信息体是同义词或近义词。(5)信息组织的过程信息组织过程包括标引和描述。控制语言及规则称为信息组织的规范。这些规范既包括对信息源外部描述的规范(如文献编目规则及各种元数据如MARC);也包括对内容描述的检索语言(如各种文献分类表及其规则,各种规范的主题词表及其规则等)。信息组织的各种形式——图书馆目录信息组织的各种形式——搜索引擎1)任务:①对原始信息源的记录,如图书的记录、网页的快照进行排列。②直接组织原始信息本身,如对图书按一定方式排列,有题名排列法,分类排列法,固定排列法(如按时间顺序)等;2)类型:①按检索工具的对象和特点划分类型A文献目录;B搜索引擎;C索引数据库等。②按检索工具的标识特征划分类型A外部特征的信息组织(如依据著者名,题名,机构名等);B内部特征的信息组织(如依据分类号,主题词);C引证关系的信息组织(依据引用关系,如SCI对期刊论文的相互引用关系进行信息组织)。(6)信息组织的任务和类型①对原始信息进行描述:对外部特征和内部特征的记录;②提供检索点:如外部特征的责任者名,题名,机构名等;如内部特征的分类号,主题词;③对原始信息内容的浓缩:包括编写内容提要或文摘。(7)信息组织的处理方式(1)信息组织与分类编目之间是总体与部分,扩展与基础的关系;信息组织既包括以印刷文献为主体的文献编目、分类标引和主题标引,也包括以网络信息为主体的网站、搜索引擎、数据库和数字图书馆等信息组织方法。(2)网络环境下分类编目仍是信息组织的重要方法;网络资源指南如雅虎就借鉴了文献分类法的原理,而国外图书馆联机公共检索目录(OPAC=OnlinePublicAccessCatalog)已经用于网络信息资源的检索。传统的分类编目和网络信息组织正在相互渗透。3、信息组织与分类编目的关系所谓信息标引,亦称文献标引,是指主要分析信息的内容属性,并用某种检索语言(如分类号G203代表信息资源及管理,G202代表信息处理技术;用规范的主题词,如激光器代替莱塞,用番茄代替西红柿)表达分析出的属性或特征,从而赋予信息或文献检索标识的过程。这种方式的信息组织主要采用两类基本方法——分类法和主题法。4、信息组织的基本任务(1)信息标引标引过程一般包括两个环节:一是主题分析,在了解和确定信息的内容属性之后,将这些属性概括为主题并用自然语言表述,同时分析主题概念之间或主题概念因素之间的结构关系;二是转换标识,即用专门的检索语言中的标识或语词表达概括信息(文献)内容的主题概念或概念因素,构成一定形式的检索标识。如对《西红柿病虫害防治》一书的主题标引为:番茄—病虫害—防治方法首先进行主题分析,本书主要谈的是西红柿病虫害及其防治方法,如用《汉语主题词表》进行主题标引,对内容分析后可直接从西红柿第一字“西”的汉语拼音xi去查西红柿,结果发现西红柿不是正式主题词,因此只能用它的学名“番茄”这个词去标引,按其标引规则其标引结果如上。(2)信息标引过程如果用《中国图书馆分类法》来进行分类标引的话,则在主题分析之后,将其标引为S436.412(番茄病虫害及其防治)。分析过程如下:西红柿是一种农作物,因此在分类表中先找到S农业科学(一级类目),第二步考虑S农业科学下面有S1农业基础科学、S2农业工程、S3农学、S4植物保护等二级类目,依其内容应归入S4植物保护,然后在其下位类中发现S436园艺作物病虫害及防治,进一步找到S436.412(番茄病虫害及其防治)。(2)信息标引过程主题法则是通过主题名称来揭示信息或文献内容并加以组织的方法;分类法是通过学科知识的分类体系来揭示信息或文献内容并加以组织的方法。两者相同之处:两者都是为揭示信息(文献)内容,都需要对信息文献进行主题分析;一般都使用预先编制的专门语言工具(主题词表或分类表);赋予的检索标识都是对信息文献主题概念的表达。两者之间的差异:1)表达主题概念的标识形式及特点不同;2)标识揭示、组织信息,文献的角度不同;3)分类法和主题法的功能、作用是互相补充的。(3)分类法和主题法的比较信息描述是对原始文献外部特征进行记录,从而提供责任者、题名等检索途径。如下图:(4)信息描述信息描述以其记录的结果——元数据为中介,对原始信息进行各种操作,信息描述(元数据)的作用是:①识别:确认并对要进行组织的信息进行个别描述,使用户能识别被组织的信息对象;②定位:提供信息资源位置的信息,以使用户访问并使用;③检索:通过在描述数据中提供检索点,便于用户对资源的检索和利用;④选择:通过记录信息资源的特征,供用户对信息资源的使用价值进行判断,决定是否使用该资源。(5)信息描述的作用元数据是关于数据的数据,或关于数据的结构化数据。元数据的含义是逐步发展的,早期的元数据主要指网络信息的描述数据,用于网络信息资源的组织(如用HTML描述网页的数据);其后,逐步扩大到各种以电子形式存在的信息的描述数据(如MARC和DC)。由于传统的书目数据与数字信息的描述数据本质上并无不同。因此,目前元数据这一术语实际上适用于各种类型的信息源的描述记录,即,网络快照是元数据;电子文本的描述数据是元数据;编目数据也是元数据(如手工编制的目录款目记录和机读目录记录MARC)。(6)元数据(Metadata)元数据是信息描述的工具,可用来描述信息组织的对象,包括不同的信息类型,可以是图书、期刊、磁带、录像带、光盘、缩微品,也可以是其中的论文、科技报告以及各种形式的网络信息等;描述的成分,通常是从信息源中抽取出来的某些外部或内容特征,如题名、版本、出版数据、相关说明等。实际上,元数据的含义与传统文献领域中的著录款目性质相同,是一种数字环境中使用的著录数据。因此,我们将元数据与描述记录、文献记录作为同义词使用。一个元数据款目构成一个信息源的基本描述记录,是检索系统的基本构成单元,它可以代表信息源本身(文献本身)用来组织目录、索引、数据库、搜索引擎等检索系统。(7)元数据的类型主要参考文献中国互联网络信息中心马张华.信息组织(2版).北京:清华大学出版社,2003俞立君,陈树年.文献分类学.武汉:武汉大学出版社,2001王松林.信息资源编目(修订本).北京:北京图书馆出版社,2005

1 / 39
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功