1网络营销与策划第五章网络营销的信息搜索策略邮箱:justdoit_long@yahoo.com.cn2中国“人肉搜索第一案”•2007年12月29日晚,女白领姜岩在北京位于东四环一小区24楼的家中人肉搜索第一案•跳楼身亡,事情源于她与丈夫王菲的婚姻。•据悉,姜岩和丈夫于2006年2月22日登记结婚。她生前在网络上注册了名为“北飞的候鸟”的个人博客,并进行写作。在自杀前两个月,她在自己的博客中以日记形式记载了自杀前两个月的心路历程,将丈夫与一名案外女性东方某的合影照片贴在博客中,并认为二人有不正当两性关系,自己的婚姻很失败。•姜岩还在自己的博客日记中显示出了丈夫的具体姓名、工作单位、地址等信息。2007年12月27日,姜岩第一次试图自杀,之前,她将自己博客的密码告诉一名网友,并委托该网友在12小时后打开博客。2007年12月29日姜岩跳楼自杀死亡后,她的网友将其博客的密码告诉了其姐姐姜红,后姜岩的博客被打开。3中国“人肉搜索第一案”•“从姜岩的朋友那里听说了这件事,我就把这个事情发到了天涯”。这位名为“撒加的橡皮鸭”的网友告诉记者,她是姜岩事件最早的爆料者,动机简单而又明确,但她没有料到事情会朝难以控制的方向发展。这篇题为《哀莫大于心死,北京从24楼跳下自杀的MM最后的日记》的帖子,几个小时内回复破千,浏览无数。网友群情激奋,认为是王菲和第三者“逼死”了姜岩。不久,大旗网刊载专题报道,天涯等社区出现了更多的贴文。•为了替“姜岩讨回公道”,网友们展开了规模浩大的人肉搜索。王菲及第三者的电话、地址、公司被一一曝光,王家每天接到莫名其妙的骚扰电话。随着“人肉搜索”入侵现实生活,王菲从此过上了“惊弓之鸟”般的生活。王菲就职的公司也迫于网民压力,辞退了他。•2008年3月,王菲将大旗网、天涯网、北飞的候鸟(姜岩朋友张乐奕所设祭奠网站,内有部分王菲信息)三家网站告上法庭,首次将“人肉搜索”和“网络暴力”推向司法领域,催生出“反网络暴力”中国第一案。尽管此前有“铜须门事件”、“虐猫事件”等网络暴力事件,但真正进入司法程序的,这在中国还是第一例。4“人肉搜索”相关事件•很黄很暴力——2007年12月27日,央视播出一条新闻,记者就“净化网络视听环境迫在眉睫”的问题采访北京市的一名小学生。•这名小学生在镜头里说道:“上次我查资料,突然蹦出一个窗口,很黄很暴力,我赶快给关了。”新闻一经播出,猫扑论坛随即出现了多个帖子来攻击“很黄很暴力”这5个字,还有人制作了色情漫画图来影射这名小学生。有人发帖号召“人肉搜索”,最终这名小学生的家庭住址等私人资料被放到了网上公开。小学生的家长随后在网上发表了一封公开信谴责这种行为。•辽宁骂人女——在纪念“512”汶川大地震全国哀悼日期间,因为网站的游戏区域被关闭,一名年轻女子便通过网络视频对此进行辱骂。愤怒的网友将视频链接到了天涯、猫扑等国内大型论坛上,并发出“号召13亿人一起动手把她找出来”的“搜索令”。5月21日下午1时,辽宁省沈阳市公安机关根据网上提供的该女子信息资料,将其抓获并拘留。“人肉搜索”把“辽宁骂人女”无情地“揪”了出来,包括其本人及父母、亲友的详细身份资料等也被悉数曝光。5第五章网络营销的信息搜索策略•5.1网上信息搜索概述•5.2搜索引擎介绍•5.3搜索引擎的使用65.1网上信息搜索概述•网络上信息搜索是指在网络上对商务信息的寻找和调取工作,这是一种有目的、有步骤地从各网站查找和获取信息的行为。•5.1.1•网上浏览75.1网上信息搜索概述•2.收藏和保存页面信息文件---另存为(保存网页…)用电子邮件直接发送Web页面采用黏贴保存法PrintScreenALT+PrintScreen3.定向浏览85.1网上信息搜索概述•4.定制信息•5.搜索引擎95.1网上信息搜索概述•5.1.2网上信息搜索的常用方法使用IE提供的搜索功能在网上搜索自动搜索?电子商务电子商务105.1网上信息搜索概述使用搜索引擎网上信息搜索概述•5.1.3网上信息搜索的技巧•布尔逻辑检索技术•截词检索技术•限制检索技术•模糊检索•邻接检索技术、加权检索、原文检索125.1网上信息搜索概述•5.1.3网上信息搜索的技巧•布尔逻辑检索技术(Boolean)•运算符:ANDORNOT•1.AND(逻辑与)空格*•写法有:AANDBABA*B••作用:缩小检索范围,提高查准率•例:吸烟与肺癌的关系•吸烟AND肺癌135.1网上信息搜索概述•5.1.3网上信息搜索的技巧•布尔逻辑检索技术(Boolean)•2.OR(逻辑或)+•写法有:AORBA+B•作用:扩大检索范围,提高查全率••例:土豆OR马铃薯•145.1网上信息搜索概述•5.1.3网上信息搜索的技巧•布尔逻辑检索技术(Boolean)•3.NOT(逻辑非)-•写法有:ANOTBA-B•作用:排除含有特定词的记录•缩小检索范围,提高查准率。••例:教育NOT学生•幼儿教育NOT中国15肝硬化or肝癌and腹水(肝硬化or肝癌)and腹水例:肝硬化或肝癌出现腹水腹水肝硬化肝癌腹水肝硬化肝癌5.1网上信息搜索概述运算符优先顺序:NOTANDOR165.1网上信息搜索概述•布尔逻辑检索在Baidu中的运用•逻辑与:空格例如:中国最长公路桥检索式应为:中国最长公路桥•逻辑或:|例如:番茄|西红柿•逻辑非:-注意”-“前必须有一个空格例如:检索不含古龙的武侠小说检索式应为:武侠小说–古龙175.1网上信息搜索概述•5.1.3网上信息搜索的技巧•截词检索技术•按截断的字符数量分有限截断和无限截断有限截断:通配符?,表示0或1个字符wom?n无限截断:通配符”*“,不确定多少字符pain*注意在中文检索系统中并不是这样185.1网上信息搜索概述•5.1.3网上信息搜索的技巧•搜索引擎中的限制检索限制搜索网站或域名关键词site:网站或域名限制查询的文件类型关键词filetype:文件扩展名关键词包含在url链接中inurl:包含在url的关键词关键词包含在网页标题中intitle:关键词链接到某个网址的网页link:网址与某个网页相似的网页related:网址19破解百度文库•首先,我们按照平常的习惯,找到自己要的,文章不能复制,题目总是可以的吧。我们把题目记住之后,在搜索引擎的框框里输入:site:wenku.baidu.com+题目•【site命令是指在制定的网站里搜索,加号也是要的,如果嫌输入加号麻烦,可以用空格代替。】•如搜索童年,输入:site:wenku.baidu.com童年(中间有空格)•搜索引擎都有网页网页快照,如百度有百度快照,谷歌有网页快照,我们点击快照进入网址.•打开网页快照或百度快照之后,我们就可以看到以网页形式显示的百度文库正文内容了。最后,我们只需要将内容复制下来就可以,粘贴到WORD等文本编辑器里,就可以保存下来了。20信息检索步骤•小结:拿到一个课题,不要盲目上机检索,先要制定好检索策略,做到胸中有数,才能有的放失。•首先透彻地分析检索课题的主题内容,确定与课题相关的主题概念,再将概念转化为检索词,注意应避免使用一般性的词作为检索词;其次,选择这些检索词的同义词和相关词。•如果检索课题是综合性或跨学科的,这类课题涉及到许多相关研究领域,仅用几个检索词是概括不了的,应在相关的研究专题领域选择相应的检索词。•然后,利用逻辑算符对检索词进行必要的逻辑组配。检索时要根据课题的需要,及时调整检索策略。当文献量过少,可使用逻辑或扩大检索范围。遇到复杂的课题,可适当考虑使用逻辑算符进行组合检索。为节省检索时间,最好由严到宽地制定几套检索策略,以供检索中随时调用。•注意事项:1.检索者使用的检索词与检索系统中规范的词语有一定差距,致使检索结果不理想;2.不同的检索系统,要求使用的检索运算符不一样,不是均支持所有运算符的组配。检索之前应先了解所使用的检索系统的要求。21检索近5年来有关国际投资流向的文献:•关键词:国际投资流向?•国际国际英国美国法国日本德国欧盟•投资风险投资证券投资银行投资股票投资基金投资资金•检索表达式(国际+英国+美国+法国+日本+德国+欧盟)AND(风险投资+证券投资+银行投资+股票投资+基金投资+资金)AND流向AND(2006+2007+2008+2009+2010)225.2搜索引擎介绍23搜索引擎发展历史元搜索引擎1995Yahoo!1994Gopher1993Archie1990第二代搜索目录搜索Google1996Baidu1999……第三代搜索网页搜索245.2搜索引擎介绍•搜索引擎的起源——Archie•所有搜索引擎的祖先,是1990年由蒙特利尔的McGillUniversity三名学生发明的Archie(ArchieFAQ)。AlanEmtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。255.2搜索引擎介绍•第二代搜索:目录式搜索Yahoo!•1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和DavidFilo共同创办了Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。Yahoo!---几乎成为20世纪90年代的因特网的代名词。265.2搜索引擎介绍•目录式搜索在严格意义上算不上真正的搜索引擎,仅仅按照目录分类的的网站链接列表而已。•元搜索引擎•元搜索引擎就是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。•27第三代搜索:网页搜索它们都属于网页自动搜索引擎,有的还带有智能分析或FTP、P2P搜索功能285.2搜索引擎介绍爬虫技术总体介绍:网络爬虫是一个自动提取网页的程序,它为搜索引擎从Internet网上下载网页,是搜索引擎的重要组成。网络爬虫使用多线程技术,让爬虫具备更强大的抓取能力。通过DNSCache技术,减少爬虫对DNS的访问频率,避免DNS成为网络瓶颈,提高抓取速度。网络爬虫还要完成信息提取任务,对于抓取回来的网页提取出来:新闻、电子图书、行业信息等。对于MP3、图片、Flash等各种不同内容,要实现自动识别、自动分类及相关属性测试(例如:MP3文件要包含的文件大小,下载速度等属性)。295.2搜索引擎介绍305.2搜索引擎介绍315.2搜索引擎介绍•5.2.2搜索引擎的工作原理:•搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。•搜索引擎至少由三部分组成:•爬行器(即机器人、蜘蛛等搜索程序)•索引生成器(即网页索引数据库)•查询检索器(即用户检索界面)•随着搜索引擎的发展,许多搜索引擎在此基础上增加特色功能。如百度增加了监控程序。32搜索引擎的工作原理就像超市索引生成器(网页数据库)爬行器(蜘蛛)查询检索器(用户查询)因特网33345.2.3搜索引擎的主要性能评价指标搜索引擎建立索引的方法搜索引擎的受欢迎程度搜索引擎的检索功能搜索引擎的检索效果35根据搜索引擎使用个数经加权调整后的市场份额——北京百度60.0%*雅虎搜索6.1%搜狐4.3%新浪3.7%其他搜索引擎3.5%*Google22.4%365.2.4国内外搜索引擎介绍•Google搜索引擎诞生于斯坦福大学的一个学生宿舍里,然后迅速传播到全球的信息搜索者。•Google目前被公认为万维网上最大的搜索引擎,它提供了简单易用的免费服务,使用户能够访问一个包含超过80亿