文献检索一、文献(literature)概述(一)相关概念(二)文献类型(三)检索途径(四)检索技术(五)检索策略(六)主题分析(一)文献概念文献是记录有知识的一切载体。人类积累创造的知识,用文字、图形、符号、声频、视频等手段记录保存下来并用以交流传播的一切物质形态的载体,都称为文献。文献检索:指从文献信息集合中查找所需文献或文献中包含的信息内容的过程。(二)文献类型按出版类型分类1、图书(Book)(教科书、专著、参考工具书等)国际标准书号ISBN(由13位数字组成)电子图书:超星数字图书馆、书生之家、读秀知识库、华人医学……2、期刊(Journal)国际标准刊号ISSN(由8位数字组成)国内统一刊号CN(6位数字)3、会议文献(ConferencePaper)4、学位论文(Dissertation)5、科技报告(Report)6、专利文献(Patent)7、政府出版物8、标准标准号:ISOGBGB/T9、产品资料10、科技档案(三)文献检索途径检索途径为检索系统的检索入口,即检索系统所提供的、用以查询获取资源的各种标识,在计算机检索中通常表现为字段检索。1、自由词检索途径2、主题词检索途径3、分类检索途径4、著者检索途径5、题名检索途径6、序号检索途径7、机构检索途径8、引文途径9、缺省检索途径10、其它途径1、自由词检索途径自由词来自于文献的标题、文摘、关键词或正文,是一种没有规范化的自然语言。如:医学词汇的简称(乙肝、心衰),生活常用语(打摆子、拉肚子)。特点:没有严格的语法规范,个人使用的爱好不同自由词选择不同(乙肝、乙型肝炎,病毒性乙型肝炎、HBV等)缺点:要查出所有的有关乙肝的文献,需要把各种可能的用词都列出来分别查询。应同时考虑所选自由词的同义词、近义词、专指词等相关词进行检索,避免漏检。2、主题词检索途径主题词又称叙词:叙词是经过优选和规范化处理的词汇,由主题词表来控制,可进行概念组配、具有完善参照系统、具有范畴索引等。所谓规范化也就是说它经过了人工规范化处理,即对文献中的同义词、近义词、多义词等加以规范,使得同一主题概念的文献相对集中在一个主题词下,同时在主题词表中采用参照系统间接反映主题概念之间与文献内容之间的关系,从而体现了主题词的单一性。例如:癌(非主题词)cancer,tumor,carcinoma见肿瘤(主题词)Neoplasms采用主题词进行检索,能较好地实现较高的查全率和查准率,缩短时间,节省费用,是提高检索技能的关键。主题词可以集中语言表达不同但是相同概念的文献,命中的文献比自由词准确。如:《医学主题词表》(MeSH)《中国中医药学主题词表》支持系统:CBM、PubMed等《医学主题词表》(MeSH)1、概述《医学主题词表》(MedicalSubjectHeadings,简称MeSH),是美国国立医学图书馆编制的权威性主题词表。它是一部规范化的可扩充的动态性叙词表。美国国立医学图书馆以它作为生物医学标引的依据,编制《医学索引》(IndexMedicus)及建立计算机文献联机检索系统MEDLINE数据库。《MeSH》汇集约18,000多个医学主题词。中文版——中国生物医学文献数据库(CBM)的MeSH表获取:MeSHBrowserUMLSMetathesaurus(超级叙词表)MeSH网站/PubMed中MeSHDatabases()《医学主题词表》(MeSH)2、主题词(Mainheadings)3、副主题词(Subheadings)又称限定词(Qualifiers),与主题词进行组配,对某一主题词的概念进行限定或复分,使主题词具有更高的专指性。如诊断(Diagnosis,DI)、药物治疗(DrugTheray,DT)、血液供给(BloodSupply,BS)等。例如肺发育不全,输入主题词“肺”后,在副主题词菜单中选择“畸形”表示发育不全;再例如,双子宫——用子宫/畸形检索。4、款目词(Entryterms)是主题词的同义词或相关词,作用是将自由词引见到主题词。《医学主题词表》(MeSH)5、范畴表范畴表又称树形结构(TreeStructure),是将字顺表中的主题词(主要叙词)、次要叙词按其学科性质、词义范围的上下类属及派生关系,分别划为16大类。大类又分若干子类目,子类目下面又分若干更小的类目,这就是通常供检索使用的主题词,共一万六千多个,都按其医学概念的性质分别列入各自所属的类目之下。3、分类检索途径文献在分类体系中的位置(类目名称或分类号)《中图法》4、著者检索途径文献上署名的作者、编者或者机关团体名称外文个人著者的处理方法:1)常规姓名:姓在前用全称,名在后用首字母缩写,例:WilliamHenryHarrison(威廉·亨利·哈里森)HarrisonWH2)姓名前有前缀de,des,du,la,della,von,van,den,dan,der等时,将前缀和姓作为一个整体,并参与排序。例:KinderVonWerderVonWerderK3)复姓人名:将复姓作为一个整体对待。如Martin-SmithM4)中国人姓名按汉语拼音著录如:韩启德→HanQD5、题名检索途径利用题名(如书名、刊名、篇名)作为检索入口,提高查准率。6、序号检索途径利用文献特有序号查找,如专利号、报告号、化学物质登记号等。7、机构检索途径以机构/单位名称为检索入口8、引文(参考文献)途径引文索引是提供某一作者及其著作在别的作者的著作中被引用状况的一种索引引文数据库,就是将各种参考文献的内容按照一定规则记录下来,集成为一个规范的数据集。通过这个数据库,可以建立著者、关键词、机构、文献名称等检索点,满足作者论著被引、专题文献被引、期刊、专著等文献被引、机构论著被引,个人、机构发表论文等情况的检索。常用的引文数据库有:科学引文索引(ScienceCitationIndex,简称SCI)社会科学引文索引(SocialSciencesCitationIndex,简称SSCI)中文社会科学引文索引(ChineseSocialSciencesCitationIndex,简称CSSCI)中国科学引文数据库(ChineseScienceCitationDatabase,简称CSCD)9、缺省检索途径指自动在检索系统预先设定的多个字段中同时进行检索。如中国知网默认的字段为“主题”,包括篇名、关键词、及摘要字段。10、其他途径《化学文摘》的分子式索引,《生物学文摘》的生物体索引。(四)文献检索技术布尔逻辑检索截词检索邻近检索字段检索扩展检索加权检索精确检索和模糊检索跨库检索相关信息反馈检索智能检索布尔逻辑检索在检索过程中用于表达词于词之间的逻辑关系的算符就称为布尔逻辑运算符。分为三种逻辑关系:逻辑与、逻辑或、逻辑非;分别用AND、OR、NOT如检索“流行性感冒或者咳嗽”,应写成:influenzaorcough如检索“流行性感冒引起咳嗽”,应写成:influenzaandcough如检索“流行性感冒不带咳嗽”,应写成:influenzanotcough如果含两个或两个以上的逻辑算符,应先算NOT,然后算AND,最后算OR。也可以用()来改变计算次序,因为()里的部分可最先算截词检索截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。用截词符号“?”“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。举例:Child*可代表child,children,childly,childhood,等等Colo?r可检索出color,colourDra???t可检索出drat,draft,draught,等等邻近检索用来表示检索词之间位置关系的检索技术,通过位置运算符来实现,采用的位置算符有with、near等。near:表示检索词位置相邻,检索词出现的顺序可前可后,如genenearapoptosis.with:表示检索词位置相邻,且两词出现的顺序与输入顺序一致,如liverwithcancer.字段检索利用检索词出现的字段进行检索。采用缩写形式的字段标识符如:TI表示TitleAU表示Author甚至采用限定符号,如:•如:hepatitisinTI•如:LA=ENGLISH扩展检索是同时对多个相关检索词执行逻辑或检索的技术即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检索出与该检索词同属于一个概念的同义词或下位词的文献,如:PubMed中主题词的扩展检索。加权检索基本方法:在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和达到或超过预先给定的阈值的记录,才能在数据库中被检出来。运用加权检索可以命中核心概念文献,因此它是一种缩小检索范围提高检准率的有效方法。但并不是所有系统都能提供加权检索这种检索技术,而能提供加权检索的系统,对权的定义、加权方式、权值计算和检索结果的判定等方面,又有不同的技术规范。如:CBM精确和模糊检索精确检索是指所检信息与输入的词组完全一致的匹配检索技术。许多系统用引号来表示,如检索“acutepancreatitis”,只有包含与acutepancreatitis完全相同词串的文献才能被检索出来。模糊检索允许所检信息与检索提问之间存在一定差异,如检索acutepancreatitis,只要包含acute和pancreatitis两个词串的文献均能检索出来,并不要求acutepancreatitis一定要按输入顺序相邻。跨库检索是一次对多个数据库同时进行检索。能为用户提供统一的检索入口将检索需求转化为不同数据库的检索表达式整合检索结果,以统一的格式将结果呈现给用户不用担心这些数据库的协议、平台、产品或生产商减轻用户学习检索不同数据库的负担有效节省检索时间相关信息反馈检索将与已检结果存在某种程度相关的信息检索出来的检索技术,多由检索系统自动进行检索。如Google的“类似网页”PubMed的“RelatedArticles”智能检索自动实现检索词、检索词对应主题词、及该主题词所含下位词的同步检索。如:中国生物医学文献服务系统(SinoMed)的智能检索。PubMed的“自动词语匹配检索”(五)检索策略检索策略—是为实现检索目标而制定的全盘计划或方案1、分析检索课题,明确检索要求(1).目的是使用户清楚其课题要解决的实质问题。是制定检索策略的根本出发点,也是检索效率高低或成败的关键(2).明确检索目的及要求(课题所属的学科范围、要求的文献类型、年限、语种、需要的文献量等)2、选择检索系统,确定检索方法1.手工检索工具(目前很少读者使用此方式)2.计算机检索系统:根据课题内容,选择合适数据库(五)检索策略3、确定检索途径,编写检索策略表达式反映文献内容特征:主题途径、分类途径等反映文献外部特征:著者途径、书(刊)名途径、代码途径用各种算符如逻辑运算符、位置算符等构造提问表达式4、根据检索结果,调整检索策略必要时对检索词或检索式进行修改,直至检出结果符合要求5、文献筛选,原文获取(六)主题分析主题是一组具有共性事物的总称,用以表达课题所研究的具体对象和问题,即课题的中心内容。主题概念是所表达对象概念属性的确定性的语词,“确定性”可以理解为对象的“本质属性”“特有属性”“共同属性”“固有属性”等主题分析是在分析信息需求的结构、类型和内容的基础上,从中提炼主题概念,确立主题类型、剖析主题结构和确定概念间关系的过程。例如,汽车追尾首先分析主题概念:交通事故然后查阅主题词表,得出相应的主题词:事故,交通要注意主题概念之间的并列关系、交叉关系、限定关系、因果关系、影响关系、应用关系、相关关