布尔逻辑检索技术

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一章文献信息检索基础第一章文献信息检索基础第一节文献信息资源及其检索概述第二节文献信息检索系统第三节文献信息检索技术第四节文献信息检索策略一、文献信息的概念1.文献2.知识3.信息第一节信息检索概述一、信息、知识、情报、文献(一)定义信息(Information):是物质存在的一种方式、形态或运动状态,是事物的一种普遍属性。知识(Knowledge):是人们在认识和改造客观世界的实践中所获得的认识和经验的总和。是人们对客观事物的本质和规律的认识。情报(intelligence):是满足一定需求的、激活了的知识文献(Literature,Document):是记录有知识的一切载体。记录知识的具体内容;记录知识的手段:如文字、图像、符号、声频、视频等;记录知识的物质载体:如纸张、光盘、录像带等;记录知识的表现形态:如图书、期刊、专利说明书等。(二)关系信息知识情报文献二、文献信息的类型按载体的不同,常将文献划分为:1.印刷型2.电子型3.声像型按出版类型,又常将文献划分为:1.图书2.期刊3.会议文献4.学位论文5.科技报告6.专利文献7.WHO出版物教科书——参考书——专著——综述——期刊论文论文——综述——专著——教科书(1)图书图书:通常被认为是由正式出版社出版的出版物。其范围很广,包括专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等。特征为出版社名称(Publication、Press)、ISBN号等分为阅读型和工具型特点:成熟,全面,可靠,时效性差用途:初步了解一般性问题实例:作者:胡鞍钢著出版社:北京大学出版社出版时间:2007-1-1字数:297000版次:1页数:395印刷时间:2007/01/01开本:印次:纸张:胶版纸ISBN:9787301115367包装:平装(2)期刊期刊:俗称杂志。是定期或不定期周期性出的连续出版物,特征为刊名、卷Vol.、期No.、国际标准刊号ISSN期刊分为:学术性(Journal)情报型:工具型(Abstracts,Index)报导型(News)综合型(Review)特点:数量大,品种多,内容丰富,出版周期短用途:获取最新研究成果和动态实例:主管:中国科学技术协会主办:中华医学会编辑:中华医学杂志编辑委员会总主编:巴德年编辑部主任:陈新石出版:中华医学会杂志社ISSN0376-2491CN11-2137/R(3)特种文献特种文献:形式比较独特,一般是单独成册,主要出版特征是号码,主要特种文献有以下八种类型。①学位论文学位论文:是高等院校硕士(Ms.D)或博士(Ph.D)毕业生为申请学位而提交的毕业论文。特征:学校名称及学位②科技报告科技报告:研究机构关于某项科研成果的正式报告,或者是对研究过程中阶段进展情况的实际记录。国防与航空航天方面居多。特征:报告号例如:NASA20050082846(美国宇航局科技报告)ADA207606(美国国防系统研究报告)DE91011930(美国能源系统研究报告)PB90226341(美国民用系统研究报告)AGARDR775(北大西洋公约组织研究报告)HY93007(航空信息研究报告)实例:中国核科技报告ChinaNuclearScienceandTechnologyReport主办:《中国核科技报告》编辑部周期:半年出版地:北京市语种:中英开本:16开ISSN1671-7430CN11-9253/TL创刊年:1985③会议论文会议文献:主要是学术会议上宣读的论文或交流的书面论文,形式有单行本(会议预印本preprint)和会议论文集。特征为:会议名称、时间、地点会议论文特点:文献论题集中,内容新颖、丰富、专、深、学术性强,能反映出一个国家、一个地区或国际上当前某一科学技术领域的最新成就、最高水平和发展趋势。实例④专利专利:发明人申请专利时呈交的申请说明书。一般包括:发明人、发明的详细说明、专利权范围、插图等。特征:专利号实例:输液自动呼叫器福建省大田星海科技开发有限公司程开海1、输液过程中瓶内药液将要滴尽时能提前自动发出声响信号,提醒护理人员注意;2、旋动呼叫器上的旋钮可直接选择用于各种规格容量药瓶(袋)输液终了的自动呼叫;3、自动呼叫后病人躺在床上可直接拉动拉线控制停呼。⑤政府出版物政府出版物:这是各国政府部门及其设立的专门机构发表、出版的文件,分为行政性文件(如法令.统计等)和科技文献(30%~40%)。⑥标准标准:主要是对工农业产品和工程建设的质量、规格及其检验方法等方面所作的技术规定,是从事生产、建设的一种共同技术依据。特征为:标准号⑦产品资料产品资料:产品资料是制造厂商为了推销产品而发出的,以介绍产品性能为主的出版物。实例:⑧科技档案科技档案:科技档案是科学技术研究和生产建设部门,在科学技术研究和生产建设活动中形成的,有具体工程对象的技术文件、图样、图表、图片、原始记录的原本或代替原本的复制本等282.认识不同内容层次的文献一次文献零次文献二次文献三次文献(1)零次文献(ZeroDocument)零次文献指未经正式发表或未进入学术交流的最原始的文献。(2)一次文献(PrimaryDocument):是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文等。(3)二次文献(SecondaryDocument):是将大量无序、分散的一次文献收集、整理、加工、著录其特征,如著者、篇名、分类、主题、出处等,并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。因其具有的检索功能而称之为检索工具或检索系统。(4)三次文献(TertiaryDocument):是科技人员围绕某一专题,借助于二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。表现形式主要有:综述(Review)、述评(Comment)、进展(Progress、Advance)、现状(Update)、发展趋势(Trend)等期刊文献和百科全书、年鉴、手册等参考工具书。文献级别举例一次文献二次文献文献级别举例三次文献零次文献科技文献层次结构知识产生记录原始文献知识重组知识浓缩词典名录指南手册年鉴书目等述评专著教科书论文丛集百科全书等三次文献期刊论文会议论文科技报告学位论文专利说明书文献整理目录索引文摘新书通报等二次文献一次文献零次文献研究活动(实验、观察、思考)信息的直接记录或传递零次文献(创造知识的素材)将知识以文字等形式固化一次文献(初始的知识产品)将分散的文献序列化二次文献(一次文献的替代品)将知识重新组合,使知识序列化三次文献(浓缩的新的信息产品)3.认识不同载体的文献印刷型文献:纸质电子型文献:缩微型文献声像型文献机读型文献(电子文献)多媒体型文献四、文献信息的特点1.数量庞大,增长迅速2.文种繁多,但呈明显的英文化趋势3.内容交叉重复4.文献形式呈现多样化5.文献分布既集中又分散,但呈专题化或专集化趋势6.知识老化加快,文献寿命(半衰期)缩短7.交流传播及变化速度加快五、文献信息的社会功能1.科技文献是科学表现的存在形式,是汇集人类财富的主要场所。2.科技文献是衡量科学技术水平的重要依据。3.科技文献是传播科学知识的最基本、最主要的手段4.科技文献是确认科学发现与技术发明优先权的认证记录。六、检索基本原理经选择的信息主题分析标引语言表达文献特征标识经确立的课题主题分析检索语言表达文献需求标识信息集合词表存储检索检索结果什么样的文献信息能够得以输出呢?匹配检索时匹配的究竟是什么?第二节文献信息检索系统一、文献信息检索系统的构成二、数据库的结构三、文献信息检索系统的分类四、文献信息检索系统的功能一、文献信息检索系统的构成1.信息资源2.硬件设备3.软件条件4.人力资源上述四方面内容构成了文献信息检索系统的空间结构,是系统运行的最基本前提。42二、类型手工检索检索手段计算机检联机检索光盘检索网络检索43二、类型文本信息检索数据格式和检索技术多媒体信息检索超媒体和超文本检索三、数据库的结构(一)从数据库组成的层次来划分1.文档(File)2.记录(Record)3.字段(Field)(二)从数据库组成的方式来划分1.顺排文档2.倒排文档字段1字段2字段3记录1记录2记录3文档1文档2文档3数据库数据库结构上述数据库的结构,可用英文单词的单复数形式更直观地表述为:RecordFields(记录)DatabaseFlies(数据库)FileRecords(文档)Fieldsearchingentry(字段)(检索入口主文档序号:N5序号:N4序号:N3序号:N2序号:N1主题词:S1著者:Au1标题:t1……S1:N1,N3S2:N2,N3S3:N1,N4……Au1:N1,N4Au2:N3Au3:N4……主题词倒排档著者倒排档……主题词检索途径著者检索途径其它检索途径主文档和倒排文档的关系示意图四、文献信息检索系统的分类1.书目型数据库2.事实数值型数据库3.全文型数据库49书目型数据库全文型数据库事实型数据库数值型数据库类型文献信息数据库书目型数据库(bibliographicdatabase):是二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。用户可从大量文献记录中筛选出有参考价值的文献源,并依据记录提供的来源指示获取一次文献。举例:中国生物医学文献数据库、PubMed(P84)、EMBASE(P93)等。1、书目型数据库全文型数据库(Full-textDatabase):收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。优点:能直接获取文献原文,集文献检索和全文提供于一体;提供全文字段检索。举例:中国学术期刊网络出版总库(CNKI)、万方数据资源的数字化期刊、OVID全文数据库、ElsevierScience的SDOS等。2、全文型数据库3、事实型数据库事实型数据库(FactDatabase):提供有关事物、人物、机构等方面的事实性信息。举例:ClinicalTrials(临床试验数据库)是通过对自愿接受试验患者的临床研究,观测药物、诊断方法、疫苗和其他治疗方法对某一种疾病或症状是否安全和有效。数据型数据库(NumericDatabase):提供数值性信息,包括各种统计数据、科学实验数据、各种测量数据等。举例:WHOSIS:可以获取以下统计数据和资料:疾病负担统计、死亡原因统计、世界卫生报告年度统计、卫生从业人员统计、人口统计、HIV/AIDS信息与数据、精神病死亡率统计、免疫接种统计等统计数据,以及疾病负担计划、国际疾病分类法及WHO术语信息系统、卫生系统成就、全球酒精数据库(GlobalAlcoholDatabase)等与卫生和卫生统计有关的资料。(P264)美国疾病控制与预防中心(CDC)的DataandStatistics等。(P266)4、数据型数据库四、文献信息检索系统的功能1.汇集文献信息2.组织文献信息3.检索文献信息上述三者之间的关系如何?理解这个问题对于整个文献检索课学习的意义何在?思考题:1.信息、知识、情报三者的联系与区别。2.分别用抽象文字与具体图示表达上述三者关系的意义。3.文献级别演化的本质及意义。4.文献信息综合应用中“综合”二字的含义。5.科技图书与科技期刊之与学术生涯。6.信息检索系统中“系统”二字的含义。7.信息检索系统构成与信息检索原理的关系。8.如何理解信息检索系统的诸多功能。第三节文献信息检索技术一、信息检索技术概念广义的包括信息组织、数据库建设在内的涉及信息科学、情报学、计算机科学等诸多学科领域

1 / 109
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功