文献信息检索与利用1课程安排第一讲文献检索基础知识----------------2周实习一机检-中文库------------------------3周第二讲中文数据库及技巧-----------------4周实习二机检-外文库(SCI/EI/Elsevier)--5周第三讲外文数据库及技巧----------------6周实习三机检-考查作业(Georef)----------7周2文献检索3图书、工具书论文(期刊论文、会议论文、学位论文)大众传媒(广播、电视、报纸)各种综合、专业数据库专业信息服务机构互联网(门户网站、专业网站、搜索引擎)信息资源获取渠道检索效率开设文献检索课的必要性⑴培养信息素质:掌握科学的检索方法、检索技能和有效利用相关信息⑵再学习的工具:及时更新知识,为终身学习做准备。4困惑:找不到、读不完5教学要求信息技能:1.掌握若干种综合性和专业性中外文检索工具—内容、特点、性能2.掌握检索方法——根据课题选择各种检索工具、制定和修改检索策略、分析检索结果、完成课题的检索任务。本课程特点1、学以致用2、讲解重点,引导正确的思路和方法3、解剖典型数据库4、考查重点:考勤、作业--及时完成作业考勤10分、作业50分、考查作业40分第一章文献信息检索基础概念文献与信息文献的类型文献的特点7本章思考题•文献有什么特点?有哪些类型?•二次文献与三次文献的特点?•一次文献与二次文献的关系?•文献检索的一般步骤?8一、文献的定义文献的内涵:知识信息文献的构成:信息知识物质载体文献作用:认识知识、存储知识、交流9101.按文献内容性质和加工程度分类:文献一次文献(Primarydocument)二次文献(Secondarydocument)三次文献(Tertiarydocument)二.文献的类型一次文献通常是指原始制作,正式发表的文献。即作者以本人的经验和研究成果为基本素材(或依据)而创作(或撰写)的文献,包括第一次报道的、第一次书写的或第一次出版的那些信息。如期刊论文、研究报告等。11什么是二次文献分散、无组织文献(某学科或专题)序化、压缩外部特征及内容特征有组织、系统文献按顺序排列全面反映该学科文献线索,节省查找时间目录、索引、文摘12三次文献•再生资源:综合、分析、重组•特性:综合性高、针对性强、系统性好、信息面广、能直接参考、借鉴。教科书、工具书、综述文章13有关恐龙绝灭的综述文章14最新动态15参考文献量大16二次文献与三次文献的区别对象不同以“篇”或“本”为单位/汇集了较多的一次文献信息用途不同查找工具/直接提供检索答案一次文献与二次文献量的区别Elsevier-2500-350Georef-4000多种刊EI-5600多种-300Scopus----14000种/1亿8千万网页1718科技文献链用户二次文献一次文献三次文献研究活动加工综合信息流首先借助三次文献,大量阅读二次文献,最后检索出一次文献,从一次文献中吸收有关具体信息。综述文章在题名上常用的词汇研究历史、研究现状、回顾、展望、综述、进展、评述等19•应用地球物理数据处理与分析[作者]杨文采[机构]中国地质科学研究院地质研究所[刊名]地学前缘-1998.5(2).-231-236[关键词]应用地球物理数据处理数据分析反演地球物理[ISSN]1005-2321[分类号]P622.2P631[文摘]从理论的和方法技术两个角度讨论了应用地球物理学数据分析当前存在的问题,并对当前学科发展前沿的非线反演问题进行了重点分析。笔者认为,当前这个领域主要存在8个理论问题,它们影响了学科的发展,同时还存在4个方法技术问题,限制了应用效果。由于从地球物理数据中提取信息和数据处理中不可避免地产生人造假象是相互矛盾的,当前的研究方向是“最大限度地从地球物理数据中提取信息的同时,有效地抑制人造假象”。主要的研究应集中在非线性技术与地球物理反演的结台部上。以开创非线性反演的理论体系。进个体系应突破正则化思维的束缚,引入非线性系统自组织、地球物理场的非线性属性等新概念,融信息科学、数理科学与地球科学为一体。20212.按文献特点和出版方式分类(12类):图书(Book)期刊(Periodical)科技报告(ReportScientificandTechnical)会议文献(Conferencedocument)学位论文(Dissertation)政府出版物(Governmentpublication)专利文献(Patentdocuments)标准文献(Standardizationdocuments)技术档案(Technicalrecord)产品资料(Referenceofarticle)报纸新闻稿(Newspaperrelease)工作文稿(Labormanuscript)文献22三、科技文献的特点1.数量庞大,增长迅速2.形式复杂,文种多样3.内容广泛、分散、交叉4.时效性强,新陈代谢频繁5.文献信息分布的不均衡20-80定律:SCI选刊--20%的期刊汇集了足够的信息以全面反映科技的最新最重要的成果与进展。第二章文献信息检索基本原理及方法文献信息检索的原理及类型文献信息工具类型文献信息检索语言23第一节文献信息检索原理及类型24一、文献检索的概念检索(retrieval):是指将文献按一定的方式组织和贮存起来,并根据用户的需要找出有关的文献的过程,其全称叫文献存贮与检索,这是广义的文献检索。狭义的文献检索仅指该过程的后半部分,即查找与索取。2526二、文献检索基本原理文献检索原理是指采用间接检索方法的原理。检索者提问标识存储系统文献特征标识比较输出命中文献27文献标引标引提问检索者(用户)数据库文献标识检索标识标识比较输入检索检索系统检索原理图输出文献检索系统的两个基本功能:1.存储功能----建立文献数据库的原则,规律,提示文献的所有信息2.检索功能28第二节检索工具类型29一、检索工具概念用以报道和检索文献的工具检索工具----根据信息检索基本原理编制301.按收录内容范围划分⑴综合性检索工具:多学科、多类型⑵专业性检索工具:仅限于某一学科领域如《化学文摘》、《地理文摘》⑶单一性检索工具:限于某一特定类型如《世界专利索引》、《国际学位论文摘要》31二、检索工具类型⑴目录⑵题录⑶文摘----文章的窗口⑷索引322.按揭示和著录方式划分第三节检索语言33本节思考题•在信息检索系统中如何沟通信息存储(文献标引)和检索两个过程?•分类语言有哪些优势?主题语言有哪些劣势?它们的异同是什么?文献的特征34外表特征内容特征题名(书名、刊名、篇名)著者号码(如专利号、报告号等)引文分类主题代码分子式、结构式文献类型文献出版事项一、检索语言概念根据文献检索需求创建的一种人工语言。又称索引语言或标引语言、检索标识系统、概念标识系统。文献检索系统内的约定性语言——沟通存储和检索标引员与检索员之间的约定语言标引:把文献的主题内容和某些具有检索意义的特征,用检索标识表示出来的过程35检索语言的特点1.具必要的语文和语法规则,能表达标引和提问的中心内容和主题2.表达概念的唯一性3.可对检索标识和提问进行比较和识别4.适用于手工和计算机检索36二、两种常用检索语言两种常用的检索语言(按检索语言结构原理划分)(1)分类语言(2)主题词语言37体系分类语言组配分类语言混合分类语言标题词语言单元词语言关键词语言叙词语言(一)、分类语言分类语言是根据一定的观点,以科学分类为基础,文献内容的科学性质为对象,按照知识门类的逻辑顺序来组织和检索文献的一种语言工具。3839中国图书馆分类法简表基本部类将图书分为社会科学、自然科学、综合三大类。社科自然科学自然科学40O数理科学和化学O1数学O11古典数学O119中国数学O12初等数学O13高等数学O14数理逻辑、数学基础O15代数、数论、组合理论O17数学分析O171分析基础O172微积分O172.1微分学O172.2积分学O173无穷级数论(级数论)O174函数论O175微分方程、积分方程O176变分法O177泛函O178不等式及其他……O3力学O4物理学O6化学O7晶体学分类标识即分类号由字母和数字组成采用等级列举表达从属关系上位类目一定能包含其各个下位类目,下位类目一定带有上位类目的属性。F2经济计划与管理TQ03化学反应过程…………F27企业经济TQ031一般化学反应过程……TQ031.2合成F276各种企业经济TQ031.3分解、裂化F276.4联合企业经济……F276.41部门间经济综合体TQ032催化反应过程F276.42科研生产联合企业TQ033生物化学过程F276.43合资经营企业41分类号越长,表示的学科范围越窄。为了清楚醒目,通常在分类号的第三位数字后,隔以,如F276.43,TQ031.3类、类目共同属性的集合一类事物的概念•TG44焊接工艺441一般方法442熔焊443电焊444电弧焊445埋弧焊(焊剂层下焊)446气焊447电铆焊…42下位类同位类上位类43体系分类语言按学科体系的层次,逐级展开,各级类目一一列举,此类目层层隶属于一个严格的等级结构体系适合熟悉专业的教学、科研人员用来按专业内容检索。体系分类法的特点:优点(1)具有学科的系统性(2)具等级结构(3)既可用于组织检索工具和检索系统,又能用于组织图书资料的分类排架缺点(1)分类法的现实性:稳定性,直线性序列和层垒制结构(2)新学科出现,原分类法过时(3)从分类途径检索,必须了解学科门类44(二)、主题词语言用文字描述文献主题三个基本特征–着眼于从事物的特性方面去提示文献主题–采用文字符号–按字顺排列–例图书:《工程材料的断裂与疲劳》45主题词语言的两个重要类型:关键词语言和叙词语言。46471.关键词语言:直接从原文的篇名、文摘或全文中抽取出来的词汇构成的,未经规范化处理。2.叙词语言:叙词语言以自然语言为基础,以概念组配为基本原理,是经规范化处理,表达主题的最小概念单元叙词的规范化①词义规范:即对自然语言中的同义词、近义词、多义词和反义词进行规范。同义词:剪接D蒙太奇;自行车D脚踏车和单车;近义词:癌Y肿瘤繁称与简称:中华人民共和国Y中国;北京大学D北大4849②词类规范:即能作叙词的词类,只限于实词中的名词、动名词和少量通用性广、使用频率高的形容词等,这些词可组配成特定概念。数词、量词、方位词只作“表外叙词”。③词形规范:包括字面形式(词序、繁简体)、标点符号、字母符号和数字等关键词、叙词的性质比较50关键词Keyword叙词(单元词)Descriptor表述文献主题内容未经规范化的名词表述文献主题内容,规范化的名词必须是文献或标题中抽出的词汇可以是文献中的词汇,也可以不是例:检索大学教育的文献•关键词EducationdepartmentEducationschoolSchoolofeducation抽取原文用词51•叙词Schoolofeducation用叙词将这一类文献统一规范分类语言与主题词语言异同1。分类语言与主题语言的出发点相同(即都从内容出发2。揭示文献内容的角度不同:分类语言是从文献内容的学科属性来系统地揭示;主题语言是从特定事物方面进行揭示。52实例:1.《水化学》入化学类O6主题词为:水;化学2.《饮用水水质监察》入卫生学类R1主题词为:水;质量监察53对文献资料的标引深度不同分类语言采用一元标引技术,即对文献内容从一个主要特征角度进行揭示,忽略了文献所涉及的其它内容,每篇文献一般仅提供一个检索标识和检索途径主题词语言采用多元标引技术,即选用多个主题词从多个角度对同一篇文献论述的主题予以详尽的揭示,提供多个检索途径。5455例:《天体、地球、生命和人类的起源》书中几个主题之间是并列关系,依据图书分类的规则,它包括了两个大类以上的主题,所以入自然科学总论N标引结果不同分类标引是从文献内容出发,将研究对象置于一定的科学体系之下,它把同一学科的文献集中在一起,却把同一主题的文献分散到不同的学科里。主题标引是把同一主题