1信息组织第一章1.信息组织的概念及基本属性:1)定义:信息是经过采集、记录、处理并以可检索的形式存储的数据2)基本属性:a.可识别性,信息是可以采集并进行记录的,它不仅可以通过人的感觉器官去感知,而且可以通过仪表进行检测和识别b.可处理性,不同形式的信息通过处理和加工(包括分类、标引、概括、归纳等),可生成所需要的信息形式c.可检索性,经处理后的信息是可以供相关用户进行搜寻和调取d.可存储性,信息可以通过有关物理载体(如磁、光、大规模集成器件等)进行存储2.信息的分类方式——加工深度按信息加工深度分,包括3类:一次文献信息、二次文献信息、三次文献信息1)一次文献信息:指一切原始的信息,包括决议、报告、记录、心得、经验、消息、创作和研究成果等为内容的原始文献资料2)二次文献信息:指对原始文献信息加工处理后的信息,包括卡片、目录、索引、文摘等;二次文献信息已经变成有序的,有规则的信息,易于存储检索传递和使用,有较高的使用价值3)三次文献信息:指通过二次文献信息提供的线索,对某一范围内的一次文献信息进行分析、研究而加工生成的第三个层次的文献信息,包括综述、述评、专题研究报告、百科全书等;这种信息产生的源头不是直接的人类社会活动,而是人类研究的结晶3.信息资源的定义1)广义信息资源:a.定义:人类社会活动中积累起来的信息、信息生产者、信息技术等信息活动要素的集合b.组成:①人类社会经济活动中经过加工处理有序化并大量积累后的有用信息的集合②为某种目的而生产有用信息的信息生产者的集合③加工、处理和传递有用信息的信息技术的集合2)狭义的信息资源:a.定义:指人类社会经济活动中经过加工处理有序化并大量积累后的2有用信息的集合b.组成:人类社会经济活动中经过加工处理有序化并大量积累后的有用信息的集合4.信息组织的概念及原则1)定义:信息组织是指利用一定的科学规则和方法,对信息外在特征和内容特征进行的规范化和整序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合①整序:的涵义一是把本质上没有必然联系的信息,为了利用和管理上的方便加以组织,二是把本质上具有必然内在联系的信息,按其自身的客观逻辑结构加以组织②优化:是在整序的基础上,针对某种目的,依据结构功能优化原理对信息进行再序化的过程,是信息整序的升华2)作用:①减少社会信息流的混乱程度②提高信息产品的质量和价值③建立信息产品与用户的联系④节省社会信息活动的总成本3)原则:①客观性,三点要求:a.信息组织中进行描述和揭示的基本依据就是信息本身。因此在描述和揭示信息内容特征必须客观而准确,要根据信息本身所反映的各种特征加以科学地反映和整序化,形成相应的信息组织的成果。b.在信息组织中,不能损害信息的本来效用,不能歪曲信息本身,不能毫无根据地、人为地添加一些不准确的思想和观点,要完整地、全面地、精确地反映信息的客观特征c.不断跟踪信息的发展变化和信息组织技术的发展变化,使信息组织与条件变化和环境变化保持客观一致性②系统性,四个关系:a.微观信息组织与宏观信息组织的关系b.信息组织机构与其他部门的关系c.信息组织工作的各个环节、过程间的关系d.不同信息的处理方法间的关系③目的性,两个必须:3a.充分围绕用户的信息需求开展工作b.必须充分注意信息人力组织机构的目标市场的需求状态及其变化特征④现代化,两个方面:a.信息组织思想观念的现代化b.信息组织技术手段的现代化5.信息组织的基本要求:1)信息内容有序化(有系统、条理、秩序、启发)2)信息流向明确化(考虑用户需求下,使其流向明确)3)信息流速适度化(把握信息传递时期)4)信息数量精约化(内容简练、简明扼要)5)信息质量最优化(提高精确度、保证可靠性、先进性)6.信息组织的方法1)优化选择标准:①相关性②可靠性③先进性④适用性方法:①比较法(时间比较、空间比较、来源比较、形式比较)②分析法③核查法④引用摘录法(SCI、SSCI)⑤专家评估法(指标评分法、德尔斐法)2)确定标识①数据项的确定(描述信息外表特征或内容性质。选取数据项应遵循原则:完整性原则、标准化原则、方便性原则、低冗余度原则、灵活性原则)②信息外表特征的加工(外表特征、物质形态加工)③信息内容特征的加工(以学科分类代码作为信息标识的分类标引、以主题词语符号作为标识的主题标引)3)组织排序①分类组织法②主题组织法③字顺组织法④号码组织法⑤时空组织法⑥超文本组织法4)改编重组①汇编法:汇编是选取原始信息中的篇章、事实或数据等进行有机排列而形成的。案例:剪报资料、文献选编、年鉴名录、数据手册、音像剪辑等等。②摘要法:对原始信息内容进行浓缩加工,即摘取其中的主要事实和数据而形成的二次信息产品。案例:如会议文摘、机械工程文摘③综述法:对某一课题某一时期内的大量有关资料进行分析、归纳、综合而成的具有高度浓缩性、简明性和研究性的信息产品。4第二章1.ISBN号(五段13位)第一段:欧洲商品编号的图书产品代码,3位,978第二段:地区号,最短的是一位数字,最长的达五位数字,0、1代表英语,7是中国出版物使用的代码第三段:出版社代码,2-5位数字,出书越多,其号码就越短第四段:书序号,1-6位,由出版社自己给出第五段:校验码2.MARC格式:MARC是MachineReadableCatalogue的英文缩写形式,即机器可读目录。MARC格式即机器可读目录格式。3.分类法:1)分类的定义:分类就是按照事物的性质、特点、用途等作为区分的标准,将符合同一标准的事物聚类,不同的则分开的一种认识事物的方法。2)分类法的定义:分类法是指将类或组按照相互间的关系,组成系统化的结构,并体现为许多类目按照一定的原则和关系组织起来的体系表,作为分类工作的依据和工具。3)分类的规则:唯一性,完整性,科学性。4.主题法:1)主题法的定义:主题法是以自然语言中的名词术语作为标识符号,并依据这些标识符号的语义和字顺,编排和组织文献信息资源建立各种查询工具和检索系统。2)主题法的演变:标题法—单元词法—叙词法—关键词法标题法:以“标题”表达文献内容主题,“标题”最初取自篇名,逐渐发展到取自文献的主题内容。叙词法:是对单元词语言的直接继承,但克服了单元词语言的不足,吸收并综合了多种标引语言的原理和方法,是能结合计算机使用的后组式语言,是目前主要的受控语言。关键词:是从文献题目或文摘、正文中提取出来的具有实质意义,能代表文献主题内容的词汇。它与叙词的区别在于非规范化,是自然语言3)搜索引擎的工作原理:搜集信息—建立索引—接受查询4)利用主题法组织网络信息的优势(主要讨论关键词法):①较高的检准率。②较强的组配性。③不存在词汇滞后问题。④具有广泛的用户基础,检索习惯和技巧易被接受。⑤抽取自动化,5速度快、成本低5)发展趋势:分类主题一体化第三章1.置标语言:(1)标准通用置标语言SGML(2)超文本置标语言HTML:是为网页创建和其它可在网页浏览器中看到的信息设计的一种置标语言。HTML被用来结构化信息——例如标题、段落和列表等等。(3)可扩展的置标语言XML:XML要比HTML强大得多,它不再是固定的标记,而是允许定义数量不限的标记来描述文档中的资料,允许嵌套的信息结构。2.XML语言的语法规则:(1)必须有XML声明语句。格式为:?XMLversion=1.0standalone=yes/noencoding=UTF-8?举例:?XMLversion=1.0standalone=noencode=UTF-8?(2)一个有效的XML文档必须要有DTD文件。格式为:!DOCTYPEtype-of-docSYSTEM/PUBLICdtd-name举例:!DOCTYPEfilelistSYSTEMfilelist.dtd(3)所有XML标记都区分大小写。(4)所有标记的属性必须用“”括起来。(5)所有的标记都必须要有一个相应的结束标记。(6)所有的空标识也必须被关闭。(7)所有的XML标记都必须合理嵌套。3.XML标记的命名规则:(1)名字中可以包含字母、数字以及其它字母。(2)名字不能以数字或“_”(下划线)开头。(3)名字不能以字母xml(或XML或XML..)开头。(4)名字中不能包含空格。4.XML语言范例:?XMLversion=1.0?myfiletitleXMLQuickStart/titleauthorajie/authoremailajie@aolhoo.com/emaildate20010115/date6/myfile信息检索1.信息组织与信息检索的关系:信息组织是信息检索的基础,信息检索是信息组织的目标(发展依据)。2.信息检索的作用:(1)能较全面地掌握有关的必要信息。(2)能提高信息利用的效率,节省时间和费用。(3)适应时代发展,提高自身信息素养。(4)经济性(竞争情报)3.如何使用搜索引擎:title:——检索词包含在网页标题中title:”科比”site:——搜索结果局限于某个具体网站或者网站频道信息检索site:”edu.cn”link:——搜索链接,检索与指定URL相链接的所有页面link:”nuist.edu.cn”4.信息检索的概述1)数据、信息、知识、情报的概念、联系、区别:a.概念:①数据:泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。一般指原始、未经处理过的数据②信息:(认识论层次)信息是认识主体所感知或表达的事物运动的状态及其变化方式③知识:是在改造世界的实践中所获得的认识和经验的总和,是人类的主观世界对客观世界概括和反映④情报:是知识通过传递并起作用的部分,或者说是传递中的有用的知识b.联系与区别:①数据经过处理仍然是数据。只有经过解释,数据才有意义,才成为信息②信息是知识的表现形式。情报是活化了的、激活了的知识③信息、知识、情报可以互相转化72)情报的三要素:知识性(根本属性)、传递性、效用性3)参考文献著录格式:①图书:主要责任者.文献题名[M].出版地:出版者,出版年②期刊:作者(多作者用逗号分开,超过3个者用“等”或etal).文章题目[J].刊物名称,年代,卷数(期数):页数③学位论文:责任者.题名[D].学位授予地址:学位授予单位,年份4)信息检索概念:①广义的信息检索包括信息的存储和检索两个过程信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。信息检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息②狭义的信息检索则仅指该过程的后半部分,即从某一信息集合中找出所需的信息的过程,相当于人们通常所说的信息查询5.信息检索的分类:(1)按检索结果内容:文献信息检索,数据信息检索,事实信息检索。(2)按组织方式:全文检索,超文本检索,超媒体检索。(3)按信息存储与检索方式:手工检索,计算机检索。6.信息检索原理1)结构框图:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统。通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。存储是为了检索,而检索又必须先进行存储。82)检索的步骤:(1)分析问题。问题分类----选择相应的检索工具分析“已知”和“欲知”信息---确定检索工具的类型分析需求的主题内容(所需信息的学科性质、特点和水平层次)---确定检索策略确定文献类型和时间范围---扩大检索思路,提高检索效果(2)选择检索工具。①传统检索工具:ⅰ.检索性工具书(二次文献):包括馆藏目录、书目、索引、文摘、文献指南。ⅱ.参考性工具书(三次文献):包括百科全书、类书、政书、年鉴、名录、手册。ⅲ.表谱性工具书:包括年表、历表和表谱。ⅳ.图录性工具书:包括地图、历史图录、人物图录、文物图录、艺术图录、科技图像