搜索引擎报告范例(4篇)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

参考资料,少熬夜!搜索引擎报告范例(4篇)【前言导读】刀客网友为您整理编辑的“搜索引擎报告范例(4篇)”精选优质范文,供您参考学习,希望对您有所帮助,喜欢就下载支持呢!关于中国搜索引擎市场的调查报告1xx中国搜索引擎市场调查报告xx科技在今天公布了一份xx年中国搜索引擎市场调查报告,这份报告是对北京、上海和广州地用户进行计算机辅助随机抽样电话访问调查后作出的。从调查报告结果可以看出,百度依然是中国搜索引擎市场的老大,市场占有率领先google40多个百分点。跟去年相比,google在中国的市场占有率下滑了个百分点,特别是可见很多google的用户已经“投靠”了百度。值得注意的是,google的下滑趋势在最近半年(xx年月~8月)有所减缓。无论是学生用户市场还是非学生用户市场,百度的市场占有率都领先于google。排在google后面的分别是雅虎搜索,搜狗和新浪搜索。搜索引擎一年前的市场份额当前的市场份额市场份额变动百度%%+13%google%%-%雅虎搜索*%%+%搜狐%%-%新浪%%-%对于搜索引擎用户群的调查可知,google的使用者仍然比百度用户有着更早的上网经历、更丰富的搜索引擎使用经验、更强的搜索引擎依赖性、更多地搜索与工作或职业相关的内容等重要行为特征。有趣的是,在非学生用户中,google使用者的平均年龄和月收入都比百度用户要高。在学生用户中,除了百度,其他几个搜索引擎的市场份额均低于它们在非学生用户中的市场份额。搜索引擎调查报告探测大众心中的秘密隐私2二月初,珍妮·杰克逊(janetjackson)因为走光事件上升为yahoo搜索的人气冠军,其搜索请求达到总数的20%,创下了yahoo搜索关键词的历史最高记录。这一数字是艳星parishilton曾经所创记录的60倍,是歌星小甜甜布莱妮的80倍。互联网上的搜索引擎已经成为反映大众趣味和关注焦点的最好工具,也许比任何其他调查统计都更为真实。参考资料,少熬夜!高频词与社会热点纵观历史,热门词汇反映了短期内大众关注的焦点,长期来看可以连缀出世事的发展脉络。美国康奈尔大学的研究人员jonkleinberg曾经做过一项调查,通过统计1790年后每年的美国国情咨文的用词,发现了不同历史时期的热门词汇。例如美国独立战争期间出现频率最高的是“民兵”和“英军”;而在1947年到1959年这段时间内,“原子弹”则被反复地提起。如今,搜索引擎声称自己知道大众心中的秘密。搜索引擎不只是被动地答疑解惑;事实上,各大搜索引擎提供了包罗万象的统计数据,这些结果也许十分有趣。keinberg认为:虽然计算机并不懂历史,但是可以通过统计blog(网页访问记录)、e-mail和网页中的文本“学习”到相关的背景知识,从而更好地理解搜索请求的含义。此外,这些统计数据还可以帮助社会学者和营销人员发现某些正在显露出的大众趋势,为他们的研究或者经营提供参考信息。在国内,搜索引擎甚至借助这种反映大众趋向的能力,向更广的商业领域主动出击。2004年2月12日,百度搜索和光线传媒共同发布了“2003年全球华人明星人气榜”。热门词汇周杰伦、《无间道》、《天龙八部》、代言人、绯闻和黑幕等榜上有名。在此之前的1月8日,百度搜索还与胡润联手发布了“2003中国大陆百富人气榜”。但是,搜索引擎有时也会不知所措。比如尝试使用google搜索哈姆雷特的名言“tobeornottobe”,会发现google竟然答非所问,罗列在页面上的是gnu’snotunix官方网站、hotornot交友网站……就是不见莎士比亚的影子。这个经典的例子引出了搜索技术的一个术语—停止词(stopword)。顾名思义,计算机的一切能力都是以计算为基础,即使阅读也不例外。搜索引擎浏览分布在各个角落的网页的同时,还在后台不停地统计词语的出现频率。有一些词语出现率极高,带来巨大的统计成本,却不包含太多的具体意义,比如汉语的“的、是、了”和英文单词“the、and”之流。如果要得出包含该词的全部结果,实在是过多了。例如遇到哈姆雷特名言中的那些高频词汇,经常导致搜索“引擎”突然熄火,因此这些单词得名“停止词”。在google“阅读”哈姆雷特的名言时,遇到了四个停止词,出于无奈,所以它只好对频率最低的“not”进行搜索,得到了一些有关“not”的流行网站。如果将此名言括上引号,google便会突然开窍,顺利地寻找到相关的网站。这一功能被称作短语搜索参考资料,少熬夜!(phrasesearch)。不过,比google更智能的是alltheweb,它已将这句名言列入搜索目录,在结果页面中直接提供了相关链接。搜索如何实现“已向英特网搜索geraldsalton。共有5,430项查询结果,这是第1~10项。搜索用时秒。”秒,体现着以google为代表的搜索引擎的快捷和高效。这一切,又是如何实现的呢?通常情况下,一间机房只能摆放10台服务器,但是google的机房内可以容纳80台服务器,因为它们都是拆掉了机壳和部分零件的裸机。larrypage和sergeybrin他们将机器的外壳拆掉,再卸下没用的芯片和零件使整机体积缩小,而且容易维护,当然也节省了租用机房的花销。google使用了超过一万台的服务器,并将其分散到五个不同地区的机房内,用以应付浩如烟海的网络信息。为了对每一次搜索请求做出快速的反应,搜索引擎在前期下足了功夫。它们在后台不停地重复三步操作。第一步,搜索引擎会不断的利用爬虫(crawler)程序搜集互联网上所有可达的网页,无论是公开的还是隐藏的—只要曾被访问过,就会招致“爬虫”上身。这样,定期外出的“爬虫”就为搜索引擎囤积起一个海量数据库。由于“爬虫”外出遵循一定的周期,有时可能跟不上网页更新的速度,所以google的“网页快照”会出现与目标页面不尽相同的情况。第二步,另一个程序会统计出缓存网页(cachedpage)中各个字词出现的频率。第三步,根据词频概括出页面的中心思想和段落大意,再按照不同的关键词提炼出索引目录。用户的每一次搜索请求都是基于这些索引计算而得,因此响应异常迅速。无论google的pagerank专利技术,还是百度全球独有的“超链分析”技术,其大致想法都差不多:统计每个网页被其它网页链接指向的情况,次数越多则级别越高,排名也就越靠前。有的搜索引擎专家指出,搜索算法上usedrank比pagerank更为准确。usedrank指的是根据用户点击搜索结果而再次做出的统计。有的页面可能通过开始的计算被排在结果的第八页,但是通过查看每条链接的属性,引擎可以将用户点击多而且浏览成功的页面提到前面来。alltheweb、yahoo和百度等搜索引擎都老老实实地统计了每一次点击,而google则非常直接,不做任何再次统计。很多服务网站认同这样一个观点,用户是懒惰的。根据点击情况做出的统计,很多用户一般只看完搜索结果的第一页,并不浏览后续页面。因此一些网站把更多参考资料,少熬夜!的搜索结果显示在第一页上,比如yahoo,它的“第一页”有20项。而新浪则把“和盘托出”的服务形式发展到了登峰造极,在情人节当天搜索“鲜花”,一下子就跳出了78个网站链接。但是google、alltheweb和百度等搜索引擎依然坚持简洁的作风,每页只显示10条搜索结果。除了搜索算法的不同,各家搜索引擎也在细化服务,推出了日趋丰富的搜索功能,比如大家钟爱的google图像搜索。其实,alltheweb的图像功能也十分优秀,它还同时支持音频、视频以及下载站点的搜索。整合搜索引擎那么,用户是否不得不逐一访问每个搜索引擎以得到最好的搜索结果呢?也许不必。搜索整合技术可以一次性地提供尽可能多的信息。搜索整合(metasearch)如果译作“后搜索”,可能听起来更时髦一些,不过这就无法体现其重新梳理搜索结果这一标志性的功能。通常的搜索是从庞杂的网络资源中按照某个线索分门别类的提取信息,而metasearch则是在其他搜索引擎的发现结果之上进行再加工,可谓是搜索的搜索。当用户向搜索整合引擎输入关键词之后,它即向若干个独立工作的搜索引擎同时发送搜索请求,并从它们的网页数据库中检索出所需的信息。搜索整合引擎没有建立自己的网页数据库,它的一切数据都来自其他的搜索引擎;所以,整合的结果也不会比其他任何一家搜索引擎的结果更好。但是,它可以将用户从重复性劳动中解放出来,同时提供更有条理的搜索结果—这也是metasearch研发之初的理想。目前搜索整合引擎大致以两种方式进行工作。比较流行的做法是将搜索结果分析整合,删除重复的条目,进而针对主题实现聚类操作。这类网站中的佼佼者有vivisimo、metacrawler和dogpile等。另一类搜索整合网站面向治学严谨的研究者,如surfwax和copernicagent。它们提供关键词的逻辑运算功能,在提供大量搜索结果的同时,协助用户挖掘信息,从而做出更深入的专题研究。第二类网站相当专业,一般需要缴费,在普通用户中并不流行。关于搜索引擎的数据●在互联网的应用排名中,搜索仅次于e-mail而位居第二;●人均每次输入关键词数量为个;●网页上的高频词汇出现率约占总字数的1/3,在实际搜索中几乎不起作用;●使用搜索引擎高级功能的用户低于%,其中一部参考资料,少熬夜!分是图书馆管理员。他们向读者提供其无法搜索到的信息,利用的工具还是搜索引擎,不过是高级功能;●2003年,百度被7800万中国网民使用了110亿次,其中有近7亿次搜索与华人明星有关。基调系统中国搜索引擎竞争环境调查报告摘要论文3基调系统的使命:推动电子商务的成功基调系统的使命是透过提供关于用户体验、营销有效性、应用服务水平和竞争策略的评审准则和观察分析,来改善电子商务的绩效表现。基调系统用户体验排行榜是行业竞争环境调查研究项目的一部分,用以了解主要网上商业的用户体验和营销有效性。排名是以大规模的行业调查研究为基础,利用了基调系统的独有方法、专利技术和调查研究方面的专业知识,来了解用户在网络上进行某个目的时所表现的行为和态度。调查研究的目的是提供具可比性的评审准则、对用户体验度的观察分析,以及这些因素对用户满意度、吸引新用户和品牌认知度方面的影响。基调系统调查研究方法概述基调系统利用独有的用户调查研究方法,量度真正的用户在互联网上进行实际搜索时的情况。使用专利的webeffective技术,基调系统收集用户与网站互动时所作出的反应和行为,并了解他们的动机。基调系统能全面理解用户的网上体验,以及网上体验与搜索题目之间的关系。对中国而言,这是首次搜索引擎公司能运用真实而深入的分析,了解用户的想法和行为,以及个中原因。共1,200位中国用户参与基调系统中国搜索引擎网站的用户体验排行榜的调查研究,其中70%的被访者来自中国的主要城市,另外30%来自其他不同地区,这次调查研究他们在使用下列搜索引擎时的情况:·阿里巴巴/雅虎中国·百度·google(中国)·搜狐/搜狗用户须就一系列的网站使用体验范畴进行指定搜索,并提供使用时的反应。调查研究网站使用体验的范畴包括:·一般搜索·新闻搜索·产品搜索·图片搜索参考资料,少熬夜!·音乐搜索在用户表达他们的反应及回答有关问题的同时,基调系统会按照超过250项评审项目,纪录他们在每个网站的行为及收集他们的反应。其后,基调系统透过一系列的指数及分析推动业务成功的因素来评估用户体验带来的影响,进一步研究有那一家网站能达到最佳的商业表现,以及有那些主要因素令它们取得成功。基调系统的调研方法1.确定研究的策略和目标2.组织大型和符合目标的参与者群体3.参与者在家中、办公室或网吧上网4.参与者通过我们的软件,回答以简体中文发出的指示和回答问题5.收集参与者的行为、想法和态度资料6.作出结论和提供可行建议结果:基调系统2005年秋季用户体验排行榜最佳网站基调系统用户综合体验排行榜是各用户体验排行中层次最高的一个,它根据调查研究中共250项用户体验的指标及评审准则,综合网站表现所得的分数来进行排名。这综合排行榜反映有那些网站在用户满意度、吸引新客户以及维护公司品牌方面最为成功。虽然

1 / 22
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功