信息组织方法体系信息组织方法体系•一信息揭示与信息组织•二信息组织方法•三信息组织手段一、信息揭示与信息组织•1.信息描述•2.信息标引•3.信息系统组织1.1信息描述•信息描述(informationdescription),是网络时代中学术界对传统“文献编目”概念的一种继承和发展。1.1.1信息描述基本原理广义文献编目包括两部分:其一是对文献内容的概括和揭示,主要通过分类标引和主题标引来实现;其二是对文献内容和形式特征进行的分析、选择和记录,即著录,英美国家所谓的描述性编目(descriptivecataloguing)或实体描述(physicalcataloguing)。在网络时代,图书馆所搜集、整理的对象已经延伸到了网络中的虚拟馆藏,网络信息已经成为了图书馆重要的信息资源。“文献编目”无论从内涵还是从外延上讲都无法涵盖现有的图书馆编目对象和编目内容。于是出现了“信息描述”、“信息组织”的概念。信息组织,就是依据一定的规则和方法,将大量原本处于无序状态的信息资源(包括实体资源和网络资源)有序化,使之形成便于使用的信息系统。这个过程如果针对的是传统印刷型和非印刷型文献实体信息资源,仍然可以称为文献编目;如果其对象还包括网络信息资源,就应当称为信息组织。1.1.2信息描述的含义信息组织就内容而言,包括信息标引、信息描述和信息排序。信息描述,是根据一定的规则和标准,对信息资源的形式特征和部分内容特征进行描述并给予记录的过程。其结果是一条由若干个信息描述项组成的有关该信息资源的书目数据记录。1.1.3网络信息资源描述A)采用ISBD(国际标准书目著录)格式描述网络信息。国际图联(IFLA)1997年为电子信息资源的著录制定出版了ISBD(ER),对信息资源的获取增加了获取方式注明(ModeofAccess),可著录信息获取的方式及URL地址。B)采用MARC格式描述网络信息。1991年LC提出了讨论以USMARC为主要架构,制定了囊括网络信息的相关字段,以后又不断修订。包括扩大网络信息资源的涵盖范围;增加、修改008字段第26位数据元的代码;5--相应字段增加$u以记录资源的URL;增设856电子文件地址与检索。C)使用专门的网络数据描述语言进行网络信息资源描述。(XML;DC)1.1.4信息描述的作用和原则•文献目录/信息资源数据库的功能。揭示功能;检索功能;管理功能。•信息描述的原则。客观性、实用性、规范性、制度化。1.1.5信息描述理论与实践的发展古代。1.中国,分类目录《七略》、《四库全书总目提要》2.西方,亚历山大图书馆《在全部学术领域指引人们写作之表记》;1548年《编目方法》;1595年《英文印本图书目录》近现代。1.欧美,19世纪中叶潘尼滋的《大英博物馆印本图书著录规则》被认为是第一部现代编目条例,即《91条规则》。博德利与《博德利图书馆目录》;朱厄特与《朱厄特规则》;克特与《印刷本字典式目录规则》;杜威与《美国图书馆协会编目规则》;德国皇家图书馆《普鲁士规则》;柳别茨基与巴黎国际编目原则会议的原则声明;英美编目条例2版。2.中国。初创阶段20世纪初-1949;奠基、发展、停顿与恢复阶段1949-1979;腾飞阶段1979底-。1979年4月中国加入ISO。《中国文献编目规则》、《西文文献编目规则》。近现代文献编目的主要理论成就1.编目标准化理论:文献编目条例。2.集中编目理论(Centralizedcataloging),由一个公认的编目中心按照统一的分编规则编制书目记录,并向多个文献收藏机构提供书目数据的一种编目协作模式。3.联合编目理论(Cooperativecataloging),若干个图书馆根据协议和统一的工作规范,分担编目工作,共享编目成果的一种编目形式。4.共享编目理论(Sharedcataloging),是集中编目和联合编目的融合体。以一个权威机构的编目数据为主,其他参加机构的补充编目数据为辅,各参加机构通力合作,完成文献编目,共享编目成果的编目形式。联机共享编目onlinesharedcataloging。5.在版编目的理论(cataloginginpublication,CIP)是一种针对图书的预先编目形式。依据相关法规,由经过授权的图书馆或其他机构在图书编辑出版过程中根据出版机构所提供的图书校样或填报的图书在版编目数据单进行编目,然后再由出版机构将编目结果印刷在图书的特定位置上的一种编目活动。6.书目控制理论(bibliographiccontrol,BC),基本含义是针对文献进行有效的组织与管理。IFLA1974年起推行世界书目控制规划UBC。制定了《个人名称》、ISBDs、采纳了ISBN、ISSN,推荐了UNIMARC、DDC。当代的信息描述理论与实践•“20世纪以来”•机读目录-增加字段描述文献网址;元数据:CDF(频道定义格式)、CDWA(艺术作品描述目录)、CIMI(博物馆信息计算机交换标准框架)、DC(都柏林核心元数据)、EAD(档案编码描述格式)、GILS(政府信息查找服务核心元数据标准)等。•元数据(metadata)又称为“描述数据”。即关于数据的数据,它是对数据内容的描述,现在常说的元数据是特指在标记语言(SGML,HTML,XML)环境下对网络信息资源进行描述的解决方案,作用是便于网络信息资源的发现、存储、管理和检索利用。DublinCore的元数据由信息资源的题名、主题、描述、来源、语言、信息资源间的关系、覆盖范围、创建者、出版者、其他信息资源的贡献者、版权、日期、信息资源类型、信息资源格式、识别符等15个著录单元构成,并将它们分成内容特征、知识产权和例证说明三大类。1.2信息标引•(一)信息标引的含义:•信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其他有意义的特征标识出来,作为文献存储与检索依据的一种文献处理过程。简单来说,标引就是依据检索语言,确定文献标识的过程。•(二)信息标引的步骤:•1.主题分析:通过讨论文献的中心思想,确定被标引文献的主题概念。•2.概念转换:以主题分析为基础,将确定的主题概念赋予检索标识的过程。•(三)信息标引的类型:•1.分类标引:依据一定的分类检索语言,对文献内容的学科性质及其检索意义的形式特征进行分析、归纳,赋予文献分类检索标识的过程。•2.主题标引:依据一定的主题词表,对文献内容的先进行主题分析,再赋予文献词语标识的过程。自动标引1.自动标引含义:是直接通过计算机的操作处理,赋予检索标识的过程。2.自动标引的类型(1)从标引深度划分:全文自动标引和题名自动标引;(2)从选用的标引词划分:叙词自动标引和关键词自动标引;(3)从标引方式划分:自动赋词标引和自动抽词标引;(4)从标引形成的标识划分:主题自动标引和分类自动标引。3.自动标引的类型•统计标引法•语言分析标引法•人工智能标引法1.3信息系统管理•信息系统组织是把经过描述和标引的信息实体和信息记录组织成一个有序的系统,•信息通过特征描述和内容揭示,获得了表示信息的标引,但这只是针对某一文献和信息单元的,把这些信息有序地组织起来才完成了信息组织的过程,这就需要信息系统组织。二信息组织方法2.1按组织对象分:文献实体组织与文献内容组织文献实体组织的对象是文献,书本指的是传统的信息资源类型,主要指印刷型的出版物,如图书、期刊、会议论文、科技报告等。文献实体组织是把这些文献及其著录和标引记录组织成一个有序的系统。如图书馆的分类排架系统、分类目录、主题目录等。2.2按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织语法信息组织有:字顺组织法、代码组织法、地序组织法、时序组织法。2.3常用信息组织法1.分类组织法2.主题组织法3.集成组织法2.3.1分类组织法1)概念:就是根据分类对象的内容性质、形式体裁、读者用途等分门别类地系统地组织事物。—谢阳群《微观信息管理》2)种类:分面分类法和体系分类法2.3.2主题组织法1)定义:以自然语言中的词语或规范化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献的排检方法。主题词:表达主题概念的词语,优选出的词语必须词义明确,避免其多义性,并受特定的词表控制。2)分类:a标题词法、b单元词法、c关键词法d叙词法a标题词法a1定义:以标题词(规范的事物名称、名词术语)作为文献主题内容的标识和检索标识的先组式主题法。规范化处理:同义词(计算机和电脑)、近义词(实验与试验)、词形(汉字的简体、繁体、异体)、词组的组合方式(正叙、倒叙、并列)、用注释方式对标题词的内涵进行限制的规范a2标题词表:《工程标题词表》(SHE)《工程标题词表》(SHE)①INFORMATIONSCIENCE⑥903②(Before01/86,usecode901)③Abstracting(Beginning01/81)③Indexing(Applycode723ifcomputerized)⑥(723)InformationDissemination④SeeINFORMATIONDISSEMINATION③InformationRetrieval(Forsystems,seeINFORMATIONRETRIEVALSYSTEMS)③InformationUseLanguageTranslationandLinguistics⑥(723)(Applycode723ifcomputerized.⑤SeealsoTRANSLATINGMACHINES)说明:①主标题词;②注释项,说明词的使用范围、用法及含义;③副标题词;④见项,指向规范化的标题词;⑤参见项,指向相关的标题词;⑥分类号(用于计算机检索)。a标题词法a3特点:优点:•使检索具有直接性与直观性;•适合于从事物出发按专题进行特性检索缺点:•缺乏按学科进行族性检索的能力;•缺乏表述专指度较高的复杂概念的能力;•缺乏多途径检索和自由扩检的能力。b单元词法b1定义:以单元词作为文献主题内容的标识和检索标识的后组式主题法。b2单元词表:专利工具中的《WPI-规范化主题词表》单元词从文献内容中抽出,再经规范,能表达一个独立的概念。是最基本的、不能再分的词汇,比如“计算机软件”不是单元词,而“计算机”和“软件”才是单元词。b单元词法b3特点:优点:强调词汇的单元化和后期组配,因此提高了主题法的灵活性;缺点:由于它过分强调词汇单元化,词汇处理方法又不甚合理,易发生错误组配,误检率较高,故实用性不是很好。C关键词法C1定义:以关键词作为文献主题内容的标识和检索标识的主题法。关键词:直接从文献题名、文摘或全文中抽取出来的有实际检索意义的信息单元(关键词)。关键词是非规范的,无需查阅标准词表,或者只编制一个“禁用词表”,它收录为数不多的禁用词,如助词、连词、介词、冠词以及一些通用概念的词。c关键词法C2特点:优点:关键词法不受词表控制,快捷简便,适于用计算机组织和检索文献信息;缺点:由于关键词法的词语不规范,影响了文献信息的查全率和查准率。d叙词法d1定义:以叙词做主题词的后组式主题法d2叙词表:《汉语主题词表》叙词:是一种以概念为基础的,经过优选的规范化名词术语,具有单义性,组配性能好的特性。D叙词法•网罗性高:能形成概念网罗性高的检索标识,概括主题所涉及的各个方面,提高查全率;•专指度高:能形成专指度高的检索标识,表达主题所包含的复杂概念,提高查准率;•能形成若干检索标识,可进行多途径检索;•完善的参照系统,可帮助选准叙词,并可进行扩检和缩检。主题语言按字顺排列,其参照系统反映的是直接上下级关系,所以无法从整体上揭示某一词族的关系,因而它所反映的族性关系不如在体系分类法中表现的充分。2.3.4集成组织法•每种信息组织方法都有其特有的功用,有些组织方法功能是互补的,集成组织法就是将多种方法结合起来使用会达到更好的效果。•如分类主题一体化的组织方法、规范组织方法与自然语言组织方法的结合。三、信息组织手段•3.1人工组织•工分类过程中,人们往往根据文献的主题内容,以公认的科学