中山医科大学医学文献检索学教研室周纯信息检索信息加工(存储)--信息检索计算机信息检索就是将大量的文献资料或数据进行加工整理,按一定格式存贮在机读载体上,建成机读数据库,利用计算机对机读型数据库进行检索的信息检索方式。信息组织的方法即信息加工、标引等(主题词、分类…….)--提高查全率、查准率对于信息用户来讲,计算机检索也就是利用电子计算机对机读型的数据库进行检索。我们这次课向大家介绍二类:•国际联机检索•光盘检索国际联机检索p191一、国际联机检索定义国际联机检索是指商业性的计算机数据库检索服务机构(亦称联机卖主)通过国际(卫星)通讯网络,为世界各地的用户终端提供人机对话式的检索的服务方式。***国际联机检索定义国际联机检索是指用户利用终端设备,通过国际(卫星)通讯网络,与世界上任何国家的大型计算机检索系统的主机联结,从而检索世界各国存储在计算机数据库中的信息资料。二、国际联机检索实现方法通过INTERNET实现国际联机检索三、国际联机检索系统概况MEDLARS、DIALOG、BRS、ORBIT、ESA-IRS、STN……P192目前比较适合于医学高等院校使用的国际联机检索系统主要有两个:1、医学文献分析与检索系统(MedicalLiteratureAnalysisandRetrievalSystem,MEDLARS)2、DIALOG系统MEDLARS系统是美国国立医学图书馆研制、发行的当今世界上最具权威性的医学文献数据库检索系统。目前拥有40多个数据库,收录自1965年以来生物医学书刊中近1300万条书目和文献题录,内容涉及生物医学的各个领域,约有4万多个国内外联机用户以及包括中国在内的16个国际检索中心。P242(PRE、OLD)MEDLINE、CANCERLIT、HSTAR、TOXLINE…...Dialog系统是由Dialog公司研制、发行的当前世界上最大的一个联机检索系统,拥有自然科学、经济、社会科学等方面的文档(数据库)近400个,文献记录总数达3亿篇,占世界计算机文献存储量的50%以上。P193BA、CA、EM…...四、国际联机检索系统的服务方式1、联机追溯检索(RetrospectiveSearch,RS)2、定题情报检索(SDI)3、联机订购原文五、国际联机检索的优缺点优点:•检索速度快,效率高;•检索范围广泛、全面;•检索途径多,方便、灵活;•检索内容新,实时性强;•检索辅助功能完善(人机对话、检索结果输出方式灵活,输出格式多样等)。缺点:•检索费用高;•对检索系统及其文档(数据库)的收录、标引、特点等问题较难了解、熟悉;•检索技术和技巧不易掌握。P254AUP255PRTP257MeSH光盘检索P199一、光盘定义光盘:即高密度光盘(CompactDisc)是近代发展起来不同于磁性载体的光学存储介质,用聚焦的氢离子激光束处理记录介质的方法存储和再生信息,又称激光光盘。光盘存储技术研究始于60年代,真正获得发展在70年代。1972年用聚焦的氢离子激光束在记录介质上烧蚀微孔的方法录制电视节目,用氢-氖激光扫描信息轨道,按反射强度的变化再现已录的信息。1978年激光电视唱片正式在市场出售。1982年出现了记录带有声音的静止图象的光盘,1984年日本研制出可反复擦写的光盘。目前,借助于各种软、硬件,光盘已可以达到数据、图象、声音的综合处理。二、光盘的种类光盘按功能可分为三类:•只读式光盘(CompactDisc-ReadOnlyMemory,CD-ROM)•写读光盘(WriteOnceReadMemory,WORM)•可擦写光盘(OpticalRandomAccessMemory,ORAM)只读式光盘是第一代光盘,信息一旦录入,用户无法改变盘片上的内容,也无法录入自己的信息。这种光盘目前技术上最成熟,应用也最广泛。写读光盘是第二代光盘,不仅可以读出已录入的信息,而且可在空白的盘片空间追加录入新的信息,但与只读光盘一样,信息一旦录入,则不能改变。可擦写光盘是第三代光盘,同磁盘一样,可以删除、改写已录入的信息,也可以在盘片空间允许的情况下录入新的信息。光盘----光盘驱动器三、光盘的结构光盘由三层构成:即盘基、记录层、防护层。盘基由有机玻璃、聚酯树酯等材料制作。记录层是光盘的核心,由碲合金或碲与氧化碲混合记录薄膜等材料组成。防护层由塑料、有机玻璃等材料构成,用以保护盘面上信息。盘片记录层上有稳定间距(1.6微米)的螺旋线(信息轨道),存储信息时,激光束聚焦在记录层的螺旋线上,使其局部升温,形成凹坑,一连串的凹坑形成信息微痕。螺旋线上没有经过激光刻蚀的平面和经过刻蚀的凹坑对应于计算机二进制编码的0和1,从而实现信息的记录。读取信息时,光盘驱动器中很细的激光束沿盘面的螺旋线轨道扫描,轨道的平面和凹坑部分反射到探测装置上,经光电转换成为计算机可识别的二进制信号,完成信息的读取和检索。四、光盘的特点1.存储容量大;2.稳定性与数据保存性好,坚固耐用;3.保存时间长;光盘信息的读取采用非接触式激光扫描,多次读取不会象磁盘、磁带那样磨损盘面,且数据信息为物理性存储,不受电磁场、光照、气温、湿度等的影响、此外,由于盘面上有保护层,密封性好,不受尘土、手印等的损害。4.结构小巧,性能价格比高。五、光盘检索系统p203(一)光盘检索系统定义及构成光盘检索系统即利用光盘驱动器和光盘数据库及其检索软件,结合计算机建立起来的信息检索系统。光盘检索系统的构成包括硬件和软件两部分。(二)光盘检索系统特点•光盘存储容量大。•使用方便,不须通讯联系,不受时间限制。•操作技能易掌握。•价格低,使用寿命长,用户易接受。•机房无特别要求,投资少。•信息获得比国际联机慢,(回溯检索须多次换盘)。(三)数据库的定义p184计算机把大量的数据项有机地集中起来存放在数据文件中,构成一个存放数据的整体,即数据库。记录各项数据以构成一张横竖对齐的二维表格形式存放于数据文件中,一个以二维表格形式存放在磁盘上的数据文件称为数据库文件(库文件)。字段篇名著者来源语种文摘文献学王柏松SUMS中文………InformJohn.SUCLCEnglish………LiverCancerWangH.CancerRes.English………所谓数据库,是由一个或有联系的多个数据库文件组成的集合。此类数据库是以数据项之间的二维关系来处理数据的,也称为关系型数据库。(四)检索策略的制订p190•分析检索课题所包含的概念•对每个概念进行检索•用逻辑运算式表达课题的检索要求•涉及的问题:逻辑运算、概念的检索•例:有关PCR诊断病毒性肝炎的文献(五)计算机检索的运算符1、逻辑运算符•逻辑与AND•逻辑或OR•逻辑非NOTP188•病毒性肝炎AND聚合酶链反应•鼻咽肿瘤OR肺肿瘤•肝炎NOT病毒性肝炎•肝炎ANDNOT病毒性肝炎2、位置算符NEAR、WITHLivernearcancerhepatitiswithtreatment(hepatitis---diagnosis)(livercancer---treatment)3、字段限定符in对某一指定数据项进行检索如:hepatitisinTI=用于限定性字段的检索如:LA=ENGLISH4、通配符*代替任意一个或多个字符如:postoperati*inAB5、范围运算=,,,=,=如:PY=1997;PY1996;PY=1994(六)关键词与主题词MeSH词表p23主题词以规范化的词汇来表达文献内容的主题,这种词汇叫主题词(叙词)。医学主题词表美国国立医学图书馆邀请专家、学者汇集约16,000多个医学主题词并加以整理,使之规范化,编制成的一个表,即《医学主题词表》(MedicalSubjectHeadings,简称Mesh)。MeSH附有各种参照和注释,它是对生物医学文献进行标引和检索的依据。医学主题词表的作用在标引人员将情报输入检索系统以及检索者(用户)利用系统内情报这两个过程中,以主题词作为标准用语,使标引和检索之间用语一致,达到最佳检索效果。在手工和联机检索前,查阅医学主题词表是制定检索策略的重要依据。cancer、carcinoma、tumor、neoplasms医学主题词表主要包括下面三部分①主题词变更表Ⅰ、XXXX年新增主题词Ⅱ、XXXX年删去主题词Ⅲ、XXXX年累积新增主题词②字顺表(AlphabeticList)字顺表将主题词、次要主题词(非主题词)、款目词(非主题词)按字顺统一排列。③范畴表(CategoriesandSubcategories)选择规范化主题词要注意的几个问题1.对于自然医学语汇中同义词、近义词、学名与俗名的处理例:Cancer*Neoplasms(近义词)GermanMeales*Rubella(同义词)VitamanC*AscorbicAcid(学、俗名)Apoplexy*CerbrovascularDisorders(同义词)DeoxyribonucleicAcid*DNA(繁、简称)有“*”者为IM规范化主题词。2.倒置主题词倒置主题词就是把复合主题词中被修饰的名词作为标目,放前面。定语放在名词之后,并用逗号分开。这样,可使医学概念相近的族性词汇集中在同一主题下,便于检索。例:SHOCK,CARDIOGENIC(心源性休克)SHOCK,HEMORRHAGIC(出血性休克)SHOCK,SEPTIC(败血性休克)SHOCK,SORGICAL(外科性休克)SHOCK,TRAUMATIC(创伤性休克)例中的复合主题词经倒置后,各种有关休克的文献都集中在SHOCK这个主题词下。3.主题词与副主题词的组配使用为了使主题词的专指性更强,主题词要与副主题词组配使用。副主题词又称限定词(Qualifiers),用它将某一主题词的概念进行复分,使主题词具有更高的专指性。在一个主题词下面往往收录了许多篇文献,为了让读者不必花太多时间从关到尾一题不漏地看所有题录,就在每一个主题词下面又用若干副主题词,以便把内容相近的文献集中到相应的副主题词下面,让读者有目的地选择查阅。1989-1990年IM使用的副主题词是77个,1991-1994年是80个。副主题词(Subheadings)脑肿瘤的外科手术BrainNeoplasms/Surgery心血管疾病的死亡率CardiovascularDisease/Mortality风湿热的病因学RheumaticFever/Etiology病毒性肝炎引起的肝癌的治疗肝炎,病毒性,人肝肿瘤治疗肝炎,病毒性,人/原发性肝肿瘤/治疗肝肿瘤/继发性并非每一个副主题词都能与任何一个主题词组配。使用每个副主题词应根据MeSH树形结构标明的范畴恰当地与主题词组配。如:Diagnosis(C,F3),是指Diagnosis只限于与C类(疾病类),F3类(行为与精神疾病)组配。如词表没有合适的副主题词,则不要擅自增加或随意勉强搭配。这时,可不用副主题词(或选用一个等义主题词)。范畴表(CategoriesandSubcategories)范畴表又称树形结构(TreeStructure)。此表是将字顺表中的主题词(主要叙词)、次要叙词按其学科性质、词义范围的上下类属及派生关系,分别划为15大类。依次用A-N,Z代表。在15个类目中,有9类又分若干子类目,加用数字代表,子类目共有101个。子类目下面又分若干更小的类目,这就是通常供检索使用的主题词,共一万六千多个,都按其医学概念的性质分别列入各自所属的类目之下。GASTROINTESTINALNEOPLASMS胃肠肿瘤INTESTINALNEOPLASMS肠肿瘤CECALNEOPLASMS盲肠肿瘤APPENDICEALNEOPLASMS阑尾肿瘤COLONICNEOPLASMS结肠肿瘤COLONICPOLYPS结肠息肉............DUODENALNEOPLASMS十二指肠肿瘤ILEALNEOPLASMS回肠肿瘤............字顺表与树形结构(范畴表)在功能上的关系及如何利用查全率与查准率是文献检索的两大要素