文献检索与科技论文写作课件-第三章-网上信息资源及其查询方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章网上信息资源及其查询方法•INTERNET三大基本概念和功能组•网上信息检索的工具、搜索方式和搜索技巧•影响检索结果的因素•使用搜索引擎时应注意事项1INTERNET三大基本概念和功能组1.1INTERNET三大基本概念1.2Internet功能组1.3Internet小技巧1.1INTERNET三大基本概念1)TCP/IP协议:传输控制与网际协议2)DN(域名)和IP地址3)URL:全球资源定位器1)TCP/IP协议•TCP是TransmissionControlProtocol(传输控制协议)的缩写,IP是InternetProtocol(网际协议)的缩写支持(HypertextTransportProtocol,超文本传输协议),该协议容许文字、图画、声音等同时传输•支持E-mail功能的SMTP(SimpleMailTransferProtocol,简单邮件传输协议)和POP(PostOfficeProtocol,邮局协议)•支持FTP功能的FTP(FileTransferProtocol,文件传输协议)2)DN(域名):DomainName•结构:由2到5段字符构成,中间用.隔开,形如host.inst.fild.stat•stat——国别代码,au(澳大利亚),ca(加拿大),cn(中国),fr(法国),it(意大利),uk(英国),美国因创建Internet优先而无此码•fild——网络分类代码,ac(学术网)、com(商用网)、edu(教育网)、gov(政府网)、mil(军事网)、net(公共网)、org(社团网)七类,1997年秋季起Internet管理机构决定未来将增设arts(文艺机构)、firm(公司企业)、info(信息服务机构)、nom(个人专用)、rec(娱乐专用)、store(商店专用)、web(万维网专用)七类代码;•inst——单位或子网代码,一般是其英文缩写;lynu(洛阳师院)•host是主机或服务器代码。:即WorldWideWeb的缩写,也称为W3或Web,被称为全球网或万维网。实质就是用文件中的关联词把相关的超文本文件链接起来,形成环球信息系统。•如我校的)IP地址•结构:一般为四段数字,中间用.隔开•分类:一般将IP地址按节点计算机所在网络规模的大小分为A,B,C三类,默认的网络掩码是根据IP地址中的第一个字段确定的。1.A类地址A类地址的表示范围为:0.0.0.0~126.255.255.255,默认网络掩码为:255.0.0.0;A类地址分配给规模特别大的网络使用。A类网络用第一组数字表示网络本身的地址,后面三组数字作为连接于网络上的主机的地址。分配给具有大量主机(直接个人用户)而局域网络个数较少的大型网络。例如IBM公司的网络。2.B类地址B类地址的表示范围为:128.0.0.0~191.255.255.255,默认网络掩码为:255.255.0.0;B类地址分配给一般的中型网络。B类网络用第一、二组数字表示网络的地址,后面两组数字代表网络上的主机地址。3.C类地址C类地址的表示范围为:192.0.0.0~223.255.255.255,默认网络掩码为:255.255.255.0;C类地址分配给小型网络,如一般的局域网和校园网,它可连接的主机数量是最少的,采用把所属的用户分为若干的网段进行管理。C类网络用前三组数字表示网络的地址,最后一组数字作为网络上的主机地址。实际上,还存在着D类地址和E类地址。但这两类地址用途比较特殊,在这里只是简单介绍一下:D类地址称为广播地址,供特殊协议向选定的节点发送信息时用。E类地址保留给将来使用。4)URL(UniformResourceLocator)•定义文件在Internet上的位置,无论其位于哪台主机、哪个子目录,只要给出文件的URL地址,就能在nternet信息海洋中准确无误地定位该文件,就象是一个全球定位器。•URL的一网页是上的一个基本单位,为了定位每个网页,引入了URL这个概念,也就是每个网页的地址被称为URL。网页一般都是在某个网站上的,也就是说一般一个网站都有很多的网页,为了很好的引导人们访问网站,他们都会把网站内网页的内容归纳提炼,组成一个目录网页,让访问者首先看到这个网页(叫做首页或主页),引导人们浏览,这个主页的URL也叫网址。1.2Internet功能组功能群基础协议URL形式主要搜索工具(1)(2)FTPFTPftp://...FTPSearchEngine(Archie)Browser;Ws_ftp(3)EmailSMTP/POPmailto:...WhitepageSearchEngineBrowser;Eudora(4)UsenetNNTPnews:...UsenetSearchEngineBrowser;WinVN(5)TelnetTELNETtelnet://...Gopher(Veronica&Jughead)etcBrowser;Netterm1.3Internet小技巧(1)有的网页禁止保存,如何保存其中的部分内容?点要保存的网页页面的浏览器的查看菜单下的源文件,会启动一个记事本程序,删除文件的body以前内容,然后将此文件另存为一个扩展名为.htm的网页文件即可。(2)如何保存flash文件?点击浏览器“工具”菜单下的“internet选项”,“常规”、“设置”、“查看文件”,在打开的文件夹下将临时文件按时间排序,查找最新文件后复制你的文件夹即可。2网上信息检索的工具、搜索方式和搜索技巧3.2.1工具:搜索引擎(SearchEngine)3.2.2搜索引擎的搜索方式3.2.3搜索引擎的检索技巧3.2.1工具:搜索引擎(SearchEngine):Internet上具有查询功能的网页的统称,如:WebSearchEngine(万维网搜索引擎)FTPSearchEngine(文件搜索引擎)Email/WhitePageSearchEngine(电子函件/白页搜索引擎)YellowPageSearchEngine(黄页搜索引擎)UsenetSearchEngine(新闻论坛搜索引擎)Meta-SearchEngine(元搜索引擎)等类型中文搜索引擎•百度http://.baidu.com•搜狐http://.sohu.com•悠游http://.goyoyo.com.cn•新浪http://.sina.com.cn•网易http://so.163.com中文搜索引擎•常青藤http://.tonghua.com.cn•若比邻http://.robot.com.cn•北极星http://.beijixin.com.cn•网典http://.cnnavigate.com.•天网http://e.pku.edw.cn/•雅虎中文http://cn.yahoo.com西文搜索引擎•http://.google.com•http://.infoseek.com•http://.excite.com•http://.yahoo.com•http://.lycos.com•http://.altavista.com•http://.metacrawler.com•http://.webcrawler.com3.2.2搜索引擎的搜索方式•简单搜索(SimpleSearch,简记作SS):指输入一个单词(关键词)或两个单词以上的词组(短语),提交搜索引擎查询,这是最基本的搜索方式。大多数搜索引擎都约定把词组或短语放在引号“”内。•高级搜索(AdvancedSearch,简记作AS):指用布尔逻辑组配方式查询,也叫定制搜索。也包括多词语句提问的任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不同。•目录搜索(CatalogSearch,简记作CS):指按搜索引擎提供的分类目录逐级查询,用户一般不需要输入查询词,而是按照查询系统所给的几种分类项目,选择类别进行搜索,因而也叫分类搜索(ClassifiedSearch)。3.2.3搜索引擎的检索技巧•5种常见的数据库检索功能:布尔逻辑检索、字符串检索、截词检索、字段检索,限制检索和位置检索•特有的检索功能:自然语言检索、概念检索、加/减(+/一)号检索、区分大小写的检索、检索结果的相关性排序1)布尔逻辑检索(1)逻辑运算符:•逻辑与:空格、+、and计算机病毒、计算机+病毒、计算机and病毒•逻辑或:|、or计算机or电脑、计算机|电脑•逻辑非:not、-彩票not山东、彩票-山东(2)注意事项:A受支持的程度不同:•完全支持,如Excite、Infoseek等均支持AND、OR、NOT全部三种运算;•部分支持,如Yahoo只支持AND、OR两种运算;•只在其“高级检索”模式中“完全支持”,而在“简单检索”模式中是“部分支持”,如HotBot、Lycos。(2)注意事项:B提供运算的方式不同:大部分仍采用常规的命令驱动方式,也有一部分是采用菜单驱动方式,即用菜单选项代替布尔运算符进行逻辑运算,如HotBot、Lycos中均提供了两个菜单选项“Allthewords”和“Anyofthewords”代表AND和OR运算。2)字符串检索(短语检索)•定义:将一个字符串(通常用双引号括起)当作一个独立的运算单元,进行严格匹配,以提高检索的精度和准确度。•逻辑运算符:“”•几乎所有的搜索引擎都支持字符串检索3)截词检索•逻辑运算符:*•在搜索引擎中,目前多只提供右截法如educat*。相当于education+ducational+educator4)字段检索和限制检索•在搜索引擎中字段检索一律表现为前缀限制的形式,如属于主题字段限制的有:“Title:”、“Subject:”,“Keyword:”、“Summary:”等;属于非主题字段限制的有:“Image:”、“text:”等。•作为一种网络检索工具,搜索引擎还提供了许多新的、带有典型网络检索特征的字段限制类型,如主机名限制(host:)、超链限制(anchor:)、域名限制(domain:)、URL限制(url:)、网址限制(site:)、E-mail限制(from:)等。使用限制词(符)(+,-)限制检索:(加权检索)限定词检索用在检索结果中必须包含或者不能包含某词语的场合,大多数系统都具有该项功能把加号(+)放在一个词的前面表示在所有检索结果中都必须包含该词。把减号(-)放在一个词的前面表示在所有检索结果中都不能包含该词。5)位置检索•又称全文查找逻辑算符,相邻度检索算符,原文检索符。由于布尔检索的“AND”运算要求AND两边的检索词在同一记录中同时存在才能命中文献,这就可能会引起误组配而造成大量误检,而位置逻辑检索是以原始记录中检索词与检索词间特定的位置关系为逻辑运算的对象,检索词用位置算符相连,就可以弥补布尔检索的缺陷。此外,这种检索也不必依赖先组式词表而直接使用自由词进行检索,因而可使检索结果更准确。•目前只有AltaVista提供临近位置运算(near运算)6)自然语言检索•定义:直接采用自然语言中的字、词甚至整个句子作提问式进行检索,如可用“WhatistheweatherinBoston”7)概念检索•在用某一检索词进行检索时,能同时对该词的同义、近义、广义和狭义词进行检索,以达扩大检索范围、避免漏检的目的。这类似于一般数据库检索中的“扩展检索”功能。•目前,只有Excite能提供此功能。8)加/减(+/一)号检索•作用相当于AND/NOT运算•几乎所有的搜索引擎都支持该功能9)区分大小写的检索•又称大小写敏感检索,这主要是针对检索词中含有人名、地名等专有名词而言的。•如在区分大小写的情况下,RockHu

1 / 55
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功