搜索引擎黄凤辉搜索引擎内容:搜索引擎的原理和类型通用搜索引擎—Google生物医学搜索引擎—HON1.1搜索引擎工作原理:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索。1.2按工作原理划分主要类型全文搜索引擎:从互联网上提取的各个网站的信息(以网页文字为主),建立的数据库,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,Google、百度等元搜索引擎(METASearchEngine):在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。机器人搜索引擎由一个称为蜘蛛(Spider)的机器人程序自动搜索信息优点:信息量大、更新及时、无需人工干预缺点:返回信息过多,有很多无用信息。元搜索引擎工作原理:元搜索引擎利用其他搜索引擎返回统一的搜索结果。返回信息量更大、更全。缺点是不能充分使用所有搜索引擎的功能目录搜索引擎以人工方式或半自动方式搜集信息信息准确、导航质量缺点是需要人工介入、维护量大、信息量少、信息更新不及时按检索内容划分通用检索工具是综合性的信息检索系统,它往往基于检索词去匹配相关的内容。时常也会因检出内容太泛而无法一一过目。如:Google、Yahoo、百度等专业检索工具是专业信息机构根据专业需求,将Internet上资源进行筛选整理、重新组织而形成专业信息检索系统,专业针对性较强。如:MedicalMatrix、HON等搜索引擎的共性分类类目表;检索框和检索按钮;基本检索;高级检索;大小写无区别;布尔逻辑算符;多种检索限定;检索结果按相关性排序。2、通用搜索引擎实例:GoogleGoogle的特色检索响应速度极快,0.5秒内应答PageRank专利网页级别技术与超文本匹配分析,客观评价网页的重要性,以提供相关性较高的搜索结果智能化的“手气不错”功能,直接连接到可能最符合要求的网页“网页快照”从服务器里直接取出缓存的网页。用不同颜色标记检索词,很醒目。图像搜索工具。2.1Google的关键词检索规则支持拼音相关检索词提示双引号“”界定短语自动“and”查询,字词键入的顺序会影响搜索结果自动排除常用字词,用“+”号可将其包含在查询字词中(“+”号前留一空格)排除检索:“-”来指定检索结果中不包括某个词(减号之前必须留一空格)。大小写无差别;检索词后键入一个空格Google搜索常用操作符,在某个特定的站点中进行搜索,“site:”例如:新闻site:gov.cn文件类型限定filetype:文件名后缀例:干细胞移植filetype:pdf检索词出现位置限定:标题:allintitle;内文:allintext例:allintitle:干细胞移植某个字词或词组的定义:define:新闻site:gov.cnallintitle:干细胞移植干细胞移植filetype:pdfGoogle翻译Google翻译2.2Google高级检索例:人类白血病的干细胞移植,不包括动物实验研究,仅限于儿童。第一检索词人类白血病第二检索词干细胞移植应包括的词儿童或者婴儿或者幼儿或者少儿不包括的词动物google的检索策略:人类白血病儿童OR婴儿OR幼儿OR少儿干细胞移植-动物还可以进一步将检索结果限定:在过去一年内、PDF格式、出现在网页内文2.4Google学术搜索学术搜索的结果都代表一组学术研究成果一篇或多篇相关文章引用该组文章的其他论文同一篇文章的多个版本在学术搜索基础上增加:作者搜索、出版物限制搜索、日期限制搜索刘启发2006-2008年在《中华医学杂志》上发表的干细胞移植的文章2.4Google图书搜索国内常用数字图书馆超星数字图书馆(已购买)书生之家数字图书馆(已购买)方正数字图书(Apabi,阿帕比)其它功能问答例如:长江的长度地图查寻例如:上海地图货币转换例如:3.5USD=?GBP计算器例如:5+2*2金融信息例如:中国石化天气查询例如:上海天气邮编区号例如:拉萨邮编区号手机号码:查找手机号的归属地,输入手机号码即可农历日历转换例如:2010年春节定义例如:定义HTML练习题:1.你知道王老吉的历史是怎样的?创始人又是谁?你能找到他的图片吗?2.在Google上查找搜索引擎的幻灯片(ppt)3.通过Google学术检索论文“抗甲突汤治疗甲亢突眼症的临床疗效观察”被引用情况。4.番石榴叶能抗何种病毒所致的腹泻?5.试用Google的图书搜索查找“宁静致远”的原文及上一句是什么。练习A检索抑郁症的定义、症状和治疗要求:1、检索结果出现在标题中2、只检索doc格式文档B去广州百万葵园,想了解去往地图和交通以便出游。C搜索歌曲“欧若拉”(要求mp3格式文件),利用网络找出歌词并查明这一歌名的涵义D瘦肉精的图片练习:A检索“干细胞移植”要求:1、检索结果出现在标题中2、只检索PDF格式文档B从本校到赤岗校区乘坐哪路公交。C去杭州出差,预订延安路上的酒店,想了解去往西湖景点周边地图和交通以便出游。D搜索歌曲“欧若拉”(要求mp3格式文件),利用网络找出歌词并查明这一歌名的涵义3、生物医学搜索引擎HON3.1、HON简介:由瑞士日内瓦国际性非盈利组织健康在线基金会(HealthontheNetFoundation)创建,1996年3月在网上发布。该网站是非常受欢迎的免费因特网门户网站。Hon的主页()。Hon主页提供了3个搜索引擎:HONcode、MedHunt和Honselect。HON可供检索的内容:HONcodeAccredited:搜索经Honcode认证过的可信站点MedicalWeb:全部医学站点HONselect:通过Mesh词搜索News:世界各地医学新闻Conferences:会议信息Images:医学图像搜索经HONcode认证的可信赖的医学网站。搜索全部的医学网站。3.2MedHunt检索符合HONcode的网站。检索经HON人工标引建立数据库(theanotatedWebsites)。检索通过HON的机器人程序MARVIN有规律地访问医学、健康网站,自动标引建立数据库(Auto-Indexdatabase)。搜索全部的医学网站。简单的限定3.3HONselect:整合了不同类型网络资源的多语言智能检索工具。包含相应的医学多媒体图片、参考文献、会议信息、新闻和网站。美国国家医学图书馆编制的33000个MeSH(医学主题词)词表为其核心部分,这些主题词可以用多语种进行检索或浏览。浏览全部33000个医学主题词通过4个最常用的类目选择主题词直接输入完整或部分关键词进行检索选择主题词输入检索词通过主题词检索结果如下主题词解释网络资源科学论文临床试验会议信息副主题词练习题:1.你知道广东凉茶王老吉的历史是怎样的?创始人又是谁?你能找到他的图片吗?2.在Google上查找关于搜索引擎的幻灯片(ppt)3.通过Google学术检索论文“抗甲突汤治疗甲亢突眼症的临床疗效观察”被引用情况。4.用HON查找爱滋病血清诊断(AIDSSerodiagnosis)研究的科学论文。5.用HON查找哮喘(asthma)研究的图像、会议信息。准确描述你的搜索练习题:1.你知道王老吉的历史是怎样的?创始人又是谁?你能找到他的图片吗?2.在Google上查找搜索引擎的幻灯片(ppt)3.通过Google学术检索论文“抗甲突汤治疗甲亢突眼症的临床疗效观察”被引用情况。4.番石榴叶能抗何种病毒所致腹泻?5.试用Google的图书搜索查找“宁静致远”的原文及出处,上一句是什么。练习题(HON):1、查找爱滋病血清诊断(AIDSSerodiagnosis)研究的最新科学论文2.放射性脑病(Radioencephalopathy)相关网络资源3、SPECT、MRI、PCR的MeSH词(规范主题词)4、哮喘(asthma)图像5、干细胞(stemcell)研究的会议信息,了解CME含义。