1第二讲:基础知识:信息源与信息检索原理王建涛2007-9-2522.6信息检索工具手工检索工具如印刷版的《全国报刊索引》。计算机检索系统如《CNKI中国学术文献网络出版总库》32.7信息检索方法顺查法:时间上,远近查全率高倒查法:时间上,近远查准率高抽查法:研究的高级阶段检索效率高追溯法(引文法):A.一次文献参考文献一次信息参考文献……近远B.一次文献引用该一次信息的文献新的一次文献……实际是由“远近”越查文献越新交替法(综合法)43.1间接检索法(即检索方法)间接检索法是借助于检索工具查获所需文献的方法,包括顺查法、倒查法和抽查法。•顺查法是经过分析,确定查找的起始年代,再利用选定的检索工具由远及近地逐年查找文献的方法。•它适用普查一定时间的全部文献,查全率较高,并能掌握课题的来龙去脉,了解其研究历史、研究现状和发展趋势。•倒查法•此法与顺查法相反,是按照时间范围,利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止。•由于这种方法重点是查检近期文献,所以能获得较新的文献信息,节省检索时间。•然而不如顺查法查全率高,容易产生漏检的现象。5是根据检索需求,针对所属学科处于发展兴旺时期的若干年进行文献查找。用这种方法能获得一批具有代表性、反映学科发展水平的文献,检索效果和效率较高,但必须熟悉学科发展的特点。抽查法6追溯检索法也叫扩展法、追踪法。此法不是利用确定的检索工具,而是利用已知文献的某种指引,如文献附的参考文献、有关注释、辅助索引、附录等,追踪查找文献。根据已知文献的指引,查找到一批相关文献;再根据相关文献的有关指引,扩大并发现新的线索,去进一步查找。如此反复追踪扩展下去,直到检索到切题的文献。用追溯法检索文献,最好利用与研究课题相关的专著与综述,因为它们所附的参考资料既多且精。在检索工具不全、文献线索很少的情况下,可采用此法。7追溯检索的更多应用文章参考文献更多文章文章作者文章作者文章作者团体更多作者文章链接网站更多链接期刊论文图书图书期刊论文8追溯检索的作用用较少的文献引出较多的文献了解科学研究的前期工作基础、相关文献、经典著作、主要作者、重点期刊等。93.2直接检索法是指直接通过浏览、查阅文献原文而获取所需文献信息的方法。这种方法不依靠检索工具,所以不是严格意义上的检索方法•优点:能够明确判断文献所包含的信息是否需要•缺点:是难以获得全面的文献,且费时费力,具有一定的盲目性和偶然性。•如果检索课题单一,文献相对集中,又熟悉检索书刊,可用这种检索方法。•对于有多个主题、文献离散度较大的课题,则不宜用此法•由于直接检索具有准确性和实用性优势,能满足用户直接获取文献的要求,因而是文献检索的必要手段。102.8信息检索步骤①分析检索课题,明确信息需求②选择检索工具,了解检索系统③确定检索途经,选定检索方法④实施检索策略,浏览初步结果⑤调整检索策略,获取所需信息11信息检索步骤示意图分析检索课题1.主题内容2.时间范围3.信息类型4.检索语种主题概念确定检索途径1.分类途径2.主题途径3.题名途径4.著者途径5.其它途径选择检索方法1.顺查法2.倒查法3.抽查法4.追溯法5.交替法信息线索确定一次信息出处1.缩写还原为全称2.音译转换成原名3.信息类型选择检索工具1.馆藏目录2.图书馆信息检索系统获取一次信息选择检索工具1.索引、文摘2.全文数据库①②③④⑤12一些疑问:如何进行信息检索?数据库检索需要哪些技术?什么是检索策略?什么是检索途径?哪些措施可以提供查全率?哪些措施可以提供查准率?……13什么是信息检索策略?执行一个课题的检索是有过程、分步来完成的,检索步骤的科学安排称为检索策略(retrievalstrategy),它是为实现检索目标而制定的全盘计划或方案。特别是在计算机检索中,策略问题是明确提出来的,必须慎重考虑,因为它可能要完成的是一个比较复杂、精细的检索课题,又是在人与机器的对话、交互中实现的。14为什么不自己拟定一个检索课题?请根据你自己的兴趣或正在学习的课程相关内容拟定一个检索课题,后面课程的实践将以你拟定的检索课题进行。有可能实践考试是自拟课题进行检索。15准则一你得到什么检索结果,取决于你怎么提问七条信息检索准则来自:看的“信息检索”文件夹内《搜索信息的七条准则》,帐号:xinwen密码:123456161分析检索课题,明确信息需求检索需求类型主题概念分析(注:是课题检索的重点和难点)检索目的(申报课题、开题报告、学术论文、成果查新、课程论文、商业需求以及其它需求类型等)文献类型(期刊论文、会议论文、科技报告、图书、专利、标准、网站等)结果形式(全文、文摘、题录、数值、事实等)检索年限(如2000年以来的文献)语种(中文、外文;英文、日文)检索结果数量(100?50?)171.1检索需求类型查找某概念的确切含义如:什么是“blog”查找某概念的背景知识如:谁最先发现青霉素查找某些事物的数值及量化指标特征型知识:一般通过事实型、数值型数据库和搜索引擎获得。18查找某一学科的一般知识如:关于分子生物学有哪些专著查找学科专业领域的新进展如:有关纳米技术的研究综述查找课题相关的专业文献最常见的!关联型知识:文献数据库19更多实例:电子元器件的技术特性数据,可用有关的电子元器件类手册、产品目录、样本或书查找;查过去某年度某种电气电子类产品的产销、贸易、市场概况,可用有关年鉴类资料;查国内外哪些大学招收电气电子类研究生,可查大学类的机构名录或校方的招生简章资料;查“自动化”一词的概念与含义,可用百科全书、学科术语类解释辞典和相关手册;查电子产品的电路图,可用相应的电路图集或手册;查钱学森的主要论著和贡献,可用名人录;等等。201.2主题概念分析从熟悉的已知文献信息入手分析检索课题的内容实质找出隐性的主题概念并将抽象的主题概念转化为具体的概念找出核心概念,排除无关概念和重复概念,简化逻辑关系明确概念间的逻辑关系来源:龚国伟.分析检索课题的方法与技巧研究.图书馆工作与研究.2006/04211.2.1分析检索课题的内容实质从镀锌残渣中回收锌•工艺?•实际是:从高品位镀锌残渣中分离铁•所以课题可以这样表述:“从锌块中分离铁”221.2.2隐性主题的处理---主题概念具体化请分析主题概念。“耐热钢”课题:高温下使用的不锈钢“不锈钢”23隐性主题具体化如:酸洗费液的处理处理:“回收”、“再生”如:煤灰利用具体利用:?检索式:(粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+……)241.2.3找出核心概念,简化逻辑关系并不是概念越多越好!抓住主题的核心:最能表达检索课题内容,而且具有实际检索意义的关键词。如“利用稻米皮糠提取天然食品色素”•稻米、皮糠、提取、天然、食品、色素•稻米、色素25排除检索意义不大的词排除检索意义不大而且比较泛指的概念•如:展望、发展趋势、现状、近况、生产工艺、应用、利用、作用、方法、影响、制备、结果不要望词生义261.2.4明确概念间的逻辑关系同义词、近义词是或的关系上位词即扩检,如“教育心理学”下位词即缩检,如“智育心理”、“德育心理”、“美育心理”、“教学心理学”、“学习心理学”、“教师心理学”、“学生心理学”等。•若多个下位词都用来检索,相对于一个上位词来说,一般是扩检。•一个下位词相对于一个上位词来说,一般是缩检。271.2.5如何选词表示具体事物名称的名词术语,如汽车、变压器、反应堆、水稻、坐标仪等;表示事物的状态或现象的名词术语,如强度、失真、土壤熟化、日冕、船舶过载等;表示科学分类的名词术语,如数学、物理学、中医学、电子学、建筑工程、水利工程等;表示研究方法、技术方法的名词术语,如分析(化学)、针刺手法、有限元法、结构功能法、力学性能试验等;本页面内容参考《汉语主题词表》28表示工艺方法、加工技术的名词术语,如铸造、锻造、热处理、焊接、酿造、取心钻进、爆破成型、激光切割等;表示化学元素、化合物、金属材料与合金的名词术语,如钠、氧原子、ⅣA族元素、钠化合物、硅化物、硫酸、钛络合物、钉胺、呋喃、吡啶、醇聚四氟乙烯、丁二酸(P)以及如金属板耐蚀钢、耐蚀合金等;表示国家名称、地名、组织机构名称及人名的专有名词以及文献类型、文献载体的名词术语,29信息检索的一般步骤1.分析检索课题,明确信息需求2.选择检索工具,了解检索系统3.确定检索途经,选定检索方法4.实施检索策略,浏览初步结果5.调整检索策略,获取所需信息30准则二:去信息应该在的地方检索312.选择检索工具,了解检索系统与检索主题相关的检索工具有哪些?*(主要看数据库的学科覆盖范围)与检索需求的文献类型相关的检索工具有哪些?(如:哪些数据库或网站中含有会议论文)语种、年限、结果形式(全文还是文摘)(如检索1989~1994年的文献,选择维普还是CNKI)322.1选择检索工具的一般方法根据不同的文献类型和语种需求选择根据利用方便、使用熟练的程度选择根据相应速度、获得支持和帮助的程度选择根据数据量、信息年限的需求选择根据经验和推荐选择332.2选择的前提:知道有哪些信息源图书馆网站的书目数字资源列表(数据库)搜索引擎如:谷歌图书搜索、百度图书搜索、谷歌学术搜索、谷歌专利搜索等网络目录提供公共信息的专门网站,如标准开放获取信息资源,如ArXiv预印本文献库342.3宏观上:“如何了解一个数据库”国际国内的在学术等领域的影响或地位服务形式(WEB、光盘、联机检索、单机)校内、国内、国外。镜像涵盖学科或主题范围文献类型(出版形式、内容层次)收录年限,收录对象数据量(记录数)文种更新频率访问模式(口令,IP控制)其它信息:帮助信息、出版者、发行者、在同行中的地位。35如何了解一个数据库样例:书生数字图书国内重要的数字图书之一服务形式:WEB/镜像涵盖学科或主题范围:所有学科文献类型(出版形式、内容层次等):电子图书,全文(一次文献)收录年限,收录对象:2001~2003,纸本图书的数字化数据量(记录数):11.4万文种:中文更新频率:年访问模式:IP控制362.4微观上:“如何检索一个特定的数据库”宏观上了解数据库,熟悉界面。利用数据库提供的检索指南(帮助、FAQ)。了解检索与浏览模式(一般检索、高级检索、分类检索、特色检索等;按主题浏览、按出版物字顺浏览等)。检索结果的获得(多种全文格式、题录信息保存、提供预印本)其它特色功能(检索策略保存、信息定制)全文阅读工具(PDF、专用阅读器)372.4如何获得数据库的检索帮助与指南信息一般数据库界面上都有“帮助”或者“检索指南”。图书馆等文献机构发布数据库时提供的使用帮助。通过Google等搜索引擎搜索。如:filetype:ppt中国期刊全文数据库38信息检索的一般步骤1.分析检索课题,明确信息需求2.选择检索工具,了解检索系统3.确定检索途经,选定检索方法4.实施检索策略,浏览初步结果5.调整检索策略,获取所需信息393.确定检索途经,选定检索方法有什么样的检索标识或检索语言,就有什么样的检索途经(检索标识:题名、主题或关键词、摘要、全文、作者、机构、分类、出版物名等)40回顾:信息检索方法413.3文献信息老化规律的应用随着时间的推移,信息的价值会逐渐衰减乃至失效。文献信息表现出老化规律。文献信息老化的情形有:所含信息仍有用,但现在已经被包含在其它更新的文献中。所含信息仍有用,但现在正处于人们对其兴趣下降的阶段。所含信息仍有用,但为后来的文献所超越。所含信息不再有用。文献的半衰期:某学科领域现时还在利用的全部文献中