Google是如何工作的讲解人员:XX日期:2011年01月17日2Google工作的基本原理工作原理(一)搜集资讯:搜索引擎靠机器人程式(spider)处理网站资料的收录工作(二)整理资讯:搜索引擎整理资讯的过程称为「建立索引」,搜索引擎不仅要保存搜集起來的资讯,还要將它们按照一定的规则进行编排(三)接受查询:用戶向搜索引擎发出查询,搜索引擎接受查询并向用戶返回资料3Google工作原理实例演示(一)你写了篇博客,发了个评论,对网站进行了更新或者添加内容到网上Google的网络蜘蛛爬取整个网络,包括你发布的内容一旦爬取后,页面会在几秒内被索引Google还可以通过博客的ping命令或者Xmlsitemap来找到你的网站从高权威性的网站获得越多外链,则这些网页获得越高的权威性如果到你网站的外链有nofollow标签,Google不会通过这些连接爬取你的网站如果你通过robot.txt告诉Google别爬取的网站,Google将不会爬取Google网络蜘蛛跟随连接进行爬取,如果你的网站没有外链,那么你的网站不会进行常规和深度爬取爬取没有nofollow标签的连接网页内容存储在一个逆索引(reverseindex)中网页标题和连接数据存在一个索引中,用于宽泛竞争激烈的搜索网页内容存在另外一个索引中,用于不常见或长尾关键字的搜索当你通过Google搜索时,不是搜索实现的网络,而是搜索Google的不断更新的4Google工作原理实例演示(二)Google根据连接评估域名和网页总体的权威性网页根据编辑政策被再次检查同时网页被分割成很多数据块,用户搜索时将使用这些数据Google的搜索质量团队和反垃圾团队反复评估和完善算法1万远程测试者对他们的搜索质量进行评分Google从用户收集网页垃圾报告数据Google根据DMCA的通知剔除侵权的内容5Google工作原理实例演示(三)用户使用Google搜索Google根据用户键入的字母或词语提供关键字建议Google将相似的同义词包含在查询中产生初步的搜索结果Google可能会找到超过百万的搜索结果,但最终显示出来的可能只有1000条(或少于1000条)搜索结果本地化:本地网站在搜索结果中将被优先推介6Google工作原理实例演示(四)根据权威性和PageRank对搜索结果进行排序同时移除重复内容Google根据关键字、广告匹配类型和用户所在地找到相关广告广告必须遵循相关政策和规定关联的广告根据潜在收入进行排序(根据竞标价格和广告质量打分)如果关键字搜索量很少或者点击量很少,广告可能自动被停止广告发布者如果不遵守相关规则,账号将被禁止大型或受欢迎的广告,比如amazon.com,可能会有折扣对大多数广告发布者来说,预先已经创建了广告内容,但有时与关键字相关的动态内容也会显示给用户有些广告可能显示扩展内容,类似sitelinks,电话号码,产品链接,所在地等。对内容进行过滤如果广告有足够高的转化率,广告可能会被显示在搜索结果上端其他的广告显示在右侧7Google工作原理实例演示(五)对内容进行过滤对于通用搜索来说,如果Google认为新闻搜索、购物搜索、视频搜索、书籍搜索、本地搜索或其他任何垂直搜索的结果和你查询的关键字有关,他们可能会直接将这些搜索结果混合显示给用户。个性化搜索:用户曾经访问过的网站通常会被优先推荐过度(excessive)或者刻意SEO的锚文字可能会从搜索结果中移除链接间的互联:如果网页被高排名网站链接,那么这些网页排名将靠前趋势:如果搜索关键字被大量搜索或最近有很多相关的新闻,Google可能会倾向于最新的结果如果同一个域名返回多个高排名的结果,会被整合在一起显示给用户显示不带广告的搜索结果8Google工作原理实例演示(六)其他的广告显示在右侧生成用户看到的搜索结果页面,所有的这一切都在一秒内完成,每天搜索超过3亿次,每年为Google产生200亿美元的收入显示不带广告的搜索结果9谢谢您的收看播放结束由于本人水平十分的有限和时间的仓促,谷歌搜索引擎内幕的具体技术细节:Google的页面级别(PageRank),GoogleUpdate和Dance的排名算法规则等没有详细的介绍。欢迎您提出宝贵意见,非常乐意与您进行交流和学习。