Scrape-Box从入门到精通完全中文教程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

ScrapeBox作为外贸SEO领域中最为常见的外链工具,几乎人手一份,虽然性能较xRumer要弱很多,但是这并没有阻挡黑帽seoer们对它的喜爱。蓝月这次带来一份超级详细的ScrapeBox中文教程,希望能帮助到跟我一样迷茫的英文SEO新人。本文主要借鉴了腿哥的《SEO中文宝典》,整理成了能被搜索引擎理解的纯文字信息,版权归腿哥所有,苏州SEO只做整理。Scrapebox主要功能区使用简介ScrapeBox作者将工作界面分为4个区域——harvester;SelectEngines&Proxies;URL’sharvested;commentposter,如果用中文解释,搜索区;代理区;URL整理区;操作区比较合适。对于其主要操作流程,可以看下面这张图:下面一个一个区域进行功能介绍:先说搜索区:搜索区功能主要有:关键词拼合;清理footprint;关键词、footprint输入区;关键词抓取按钮;关键词导入功能代理区:这个区很重要,会直接影响到Scrapebox搜刮资源以及发布资源的效率和成功率。代理区主要由搜索结果来源(搜索引擎);代理IP存放区;代理IP管理区URL整理区:这个区是Scrapebox的主要操作区,涉及到了URL列表存放区;去重过滤按钮;整理URL到根目录;PR查询;收录查询;邮箱抓取;导入URL;导出URL;导出URL≺开始收割资源等10个项目。操作区:当填写完footprint、整理了代理列表、搜刮到你想要的资源之后,你就可以在这个区里面操作了,这个区主要由4部分组成,分别是操作模式选择区;群发网站信息;状态区;开始操作区当你选择不同的操作模式,工具会显示对应的操作区,也只有对应的操作区可以操作,其他的不可操作去都是灰色的。Scrapebox菜单栏设置介绍菜单区:Settings菜单AdjustMaximumConnection调整最大连接数,在批量检查PR、批量群发的时候,最大链接数越多,能够增加群发的效率,降低群发的时间,但是我个人建议保持默认比较好。Adjusttimeoutsettings如果你网速很好,超时设置可以把时间设置的短一些,如果你长期出现超时,那么设置长一些是比较好的。PostOnlyusingSlowCommenter只使用慢速评论模式。快速模式虽然可以增加效率,但是却降低了成功率,慢速模式可以增加成功率。UseMultiThreadedHarvester多线程模式会增加收割的速度,但是增加了PC的CPU的负担,如果你电脑配置够好,可以使用多模式。AdjustMutiThreadedHarvesterProxyRetries这一项是表示当SB发现代理报404后,他会尝试多少次。建议使用默认。FastPosterConnectionBalancing使用该项设置以后,SB会将LIST以500为单位就行分割。一个500URLlist处理完以后,再处理下一个500url的list,这样能够最大限度的降低对硬件的要求。Option菜单UseCustomUserAgents、EditCustomUserAgentsuseragent意思是用户代理,UserAgents用户代理是指浏览器,它的信息包括硬件平台、系统软件、应用软件和用户个人偏好.用户代理,它还包括搜索引擎。你访问web时,服务器会记录你的用户代理、IP等情况。最好使用个性化的useragent,国外有个关于useragent的网站,你可以自己去复制一个。地址:这个选项要配合TheCrashdumpLogger使用,使用该功能以后,CrashdumpLogger会启用一个独立的进程来记录你的操作,然后当你机器崩溃、SB崩溃的时候,你正在harvester、commenter的数据可以恢复,不用重头开始。SetupEmailNotificationServer设置邮件提醒,这个功能对那些使用桌面邮件系统的用户比较好,比如你在远程服务器上设置的任务完成后,SB会发邮件通知你。Scrapebox的RSS提交Scrapebox也有RSS提交功能,但是他只能批量提交RSS,不能提交非RSS模式的URL,但是现在很多网站都提供单独页面URL批量ping的功能,比如网站做好以后、外链群发后URL都可以用来批量ping,通过ping功能可以加快页面的收录速度。编辑Scrapebox的RSS服务:Scrapebox中为每个页面设置指定关键词在Scrapebox中,博客评论有两个区域可以添加链接——website表域、评论区。但是评论区(comments)添加链接会降低发送成功率,同时也容易让进入Akismet黑名单。那么最好做工作的区域就只剩下website表域了。但是博客Name资料会被Scrapebox用作website的锚文本,并且Name域list中的哪个资料会被用作锚文本,我们无法确定。我们很多时候又需要为每个页面设置一个独特的关键词锚文本,为了解决这个矛盾,可以使用如下下技巧:在websites域list中采用如下形式来写:{keywords1|keywords2|keywords3}{keywords4|keywords5|keywords6}……然后name域list可以不用填。发送出去后的html效果是:腿哥Scrapebox中的代理问题免费代理、共享代理、私人代理由于Scrapebox需要大量的群发、收割搜索引擎结果等,操作过于频繁容易导致IP被封。虽然使用代理会在一定程度上降低成功率,但是这可以保证你不被封IP,任务可以完成。代理分免费代理、共享代理、私人代理。免费代理也就是Scrapebox代理抓取到的IP,这些代理每天使用的人很多,很容易导致你群发的评论被封,在使用免费代理做群发前,请抓取最新的代理IP。共享代理是参加付费服务的用户共用的一些代理IP,共享代理IP的群发效果要比免费代理好些,但是也会由于使用的人过多,导致成功率降低。私人代理完全是个人独享的,你群发的成功率完全由你自己的操作所控制,但是要整几十个代理IP一个月的费用也是不小的,老外推荐免费代理适用于抓取关键词、抓取博客list这样的基础性工作;共享代理、私人代理可以用来做群发,它可以提高你的成功率。WordPress垃圾评论系统Akismet黑名单判断标准WordPress很多用户由于被spam的太厉害了,国外用户一般都会开启Akismet来防御spam群发。Akismet判断群发spam的标准有三:一、同一域名被5-10个用户手工判为spam,那么Akismet就会把这个域名列入黑名单;群发评论无法通过Akismet保护的博客;二、在30分钟内群发100条评论以上的域名将被判为spam,那么Akismet就会把这个域名列入黑名单;群发评论无法通过Akismet保护的博客;三、在30分钟内群发100条评论以上的IP将被判为spam,那么Akismet就会把这个IP列入黑名单;该IP下的群发评论无法通过Akismet保护的博客;利用Proxyfire来挖掘最新的Scrapebox代理资源Proxyfire本文不做详细介绍,只是略微提及一下,大概方法就是先随便找一些代理IP,无所谓是否过期,然后选择Proxyfire选项卡中的搜索引擎吸附,在关键字选项中把那些你找到的代理IP复制进去,然后开始搜索、验证。之后再把验证完了的代理IP导入到Scrapebox当中进行验证。验证过程可以在上面提到的线程和超时设置里面更改。SCRAPEBOX的Footprint使用Footprint在中文里的翻译是“脚印、足迹”,该词常被应用到搜索互联网资源。在讲下面的资料前,给大家讲讲基本的搜索引擎搜索命令:allinanchor:keywordsanchor是一处说明性的文字,它标注说明了这个链接可能跳转到其它的网页或跳转到当前网页的不同地方。当我们用allinanchor提交查询的时候,Google会限制搜索结果必须是那些在anchor文字里包含了我们所有查询关键词的网页。例[allinanchor:bestmuseumsSydney],提交这个查询,Google仅仅会返回在网页anchor说明文字里边包含了关键词”best”“museums”和”Sydney”的网面。allintext:keywords当我们用allintext提交查询的时候,Google会限制搜索结果仅仅是在网页正文里边包含了我们所有查询关键词的网页。例[allintext:travelpackinglist],提交这个查询,Google仅仅会返回在一个网页包含了三个关键词”travel”“packing”和”list”的网页。allintitle:keywords当我们用allintitle提交查询的时候,Google会限制搜索结果仅是那些在网页标题里边包含了我们所有查询关键词的网页。例[allintitle:detectplagiarism],提交这个查询,Google仅会返回在网页标题里边包含了”detect”和”plagiarism”这两个关键词的网页。allinurl:keywords当我们用allinurl提交查询的时候,Google会限制搜索结果仅是那些在URL(网址)里边包含了我们所有查询关键词的网页。例[allinurl:googlefaq],提交这个查询,Google仅会返回在URL里边包含了关键词”google”和”faq”的网页,象等的网页。author:keywords当我们用author进行查询的时候,Google会限制返回结果仅仅是那些在Google论坛里边,包含了特定作者的新闻文章。在这里,作者名可以是全名,也可以是一部分或邮件地址。例[childrenauthor:johnauthor:doe]或[childrenauthor:doe@someaddress.com]返回结果将是作者JohnDoe或是doe@someaddress.com写的,关于包含关键词children的文章。cache:提交cache:url,Google会显示当前网页的快照信息,从而替换网页的当前信息。例[cache:],提交这个查询,Google会返回所有抓取的关于的网页快照信息。在显示的网页快照信息里边,Google会高亮显示查询关键词。(在cache:和URL之间不能有空格)inanchor:当我们用inanchor提交查询的时候,Google会限制结果是那些在网页anchor链接里边包含了查询关键词的网页。例[restaurantsinanchor:gourmet],提交这个查询,Google会查询那些在anchor信息里包含了关键词”restaurants”和关键词”gourmet”的网页。intext:当我们用intext进行查询的时候,Google会返回那些在文本正文里边包含了我们查询关键词的网页。[HamishReidintext:pandemonia],提交这个查询的时候,Google会返回在文本正文包含查询关键字pandemonia,在其它任何地方包含关键词”Hamish”和”Reid”的网页。(intext:后面直接跟查询关键字,不能有空格)intitle:当我们用intitle进行查询的时候,Google会返回那些在网页标题里边包含了我们查询关键词的网页。例[flushotintitle:help],提交这个查询,Google会返回在网页标题包含了查询关键字”help”,而在其它任何地文包含了查询关键字”flu”和

1 / 18
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功