高性能HTTP加速器Varnish(安装配置篇)一、安装VarnishVarnish的安装非常简单,下面逐步介绍:1、安装前的准备Varnish安装环境如下表1所示:表1主机名操作系统IP地址Varnish-serverCentOSrelease5.4192.168.12.246Web-serverCentOSrelease5.4192.168.12.26接着,建立varnish用户以及用户组,并且创建Varnish缓存目录和日志目录:[root@varnish-server~]#useradd-s/sbin/nologinvarnish[root@varnish-server~]#mkdir/data/varnish/cache[root@varnish-server~]#mkdir/data/varnish/log[root@varnish-server~]#chown-Rvarnish:varnish/data/varnish/cache[root@varnish-server~]#chown-Rvarnish:varnish/data/varnish/log2、获取varnish软件Varnish的官方站点为,这里面有varnish的最新说明文档,以及版本升级记录,从此站点可以找到varnish在SourceForge的下载链接,目前,varnish的最新版本是Varnish2.1.2,下载完成后的包名为varnish-2.1.2.tar.gz,此处我们就以此版本为例,进行安装配置。3、安装pcre如果没有安装Pcre,在编译varnish2.0以上版本时,会提示找不到pcre库,而pcre库是为了兼容正则表达式,所以必须先安装pcre库。[root@varnish-server~]#tarzxvfpcre-7.9.tar.gz[root@varnish-server~]#cdpcre-7.9/[root@varnish-server~]#./configure--prefix=/usr/local/pcre/[root@varnish-server~]#make&&makeinstall4、安装varnish这里我们将varnish安装到/usr/local/目录下,操作如下:[root@varnish-server~]#tar-zxvfvarnish-2.1.2.tar.gz[root@varnish-server~]#cdvarnish-2.1.2[root@varnish-server~]#exportPKG_CONFIG_PATH=/usr/local/pcre/lib/pkgconfig[root@varnish-server~]#./configure--prefix=/usr/local/varnish\--enable-dependency-trackin--enable-debugging-symbols--enable-developer-warnings[root@varnish-server~]#make[root@varnish-server~]#makeinstall[root@varnish-server~]#cpredhat/varnish.initrc/etc/init.d/varnish[root@varnish-server~]#cpredhat/varnish.sysconfig/etc/sysconfig/varnish其中,“PKG_CONFIG_PATH”是指定varnish查找pcre库的路径,如果pcre安装在了其它路径下,在这里指定相应的路径即可,Varnish默认查找的pcre库路径为/usr/local/lib/pkgconfig。最后两步操作是拷贝一些varnish守护进程的初始化脚本文件,这些脚本用于varnish的启动、关闭管理等方面,在下面章节中会进行详细讲解。至此,varnish安装完毕。二、配置Varnish1、VCL使用说明VCL,即为VarnishConfiguationLanguage,用来定义varnish的存取策略,VCL语法比较简单,跟C和perl比较相似,可以使用指定运算符“=”,比较运算符“==”,逻辑运算符“!,&&,!!”等形式。还支持正则表达样和用“~”进行ACL匹配运算,同时还可以使用“set”这样的关键字来指定变量。需要注意的是,“\”字符在VCL里没有特别的含义,这点与其它语言略有不同,另外,VCL只是配置,并不是真正的编程语言,没有循环,也没有自定义变量。在讲述Varnish配置之前,首先需要了解下varnish的配置语法,即VCL,下面对VCL常用的一些内置函数和公用变量进行详细介绍。VCL内置函数(1)vcl_recv函数用于接收和处理请求,当请求到达并成功接收后被调用,通过判断请求的数据来决定如何处理请求。此函数一般以如下几个关键字结束:pass:表示进入pass模式,把请求控制权交给vcl_pass函数。pipe:表示进入pipe模式,把请求控制权交给vcl_pipe函数。errorcode[reason]:表示返回“code”给客户端,并放弃处理该请求,“code”是错误标识,例如200、405等,“reason”是错误提示信息。(2)vcl_pipe函数此函数在进入pipe模式时被调用,用于将请求直接传递至后端主机,在请求和返回的内容没有改变的情况下,将不变的内容返回给客户端,直到这个链接关闭。此函数一般以如下几个关键字结束:errorcode[reason]pipe(3)vcl_pass函数此函数在进入pass模式时被调用,用于将请求直接传递至后端主机,后端主机应答数据后送给客户端,但不进行任何缓存,在当前连接下每次都返回最新的内容。此函数一般以如下几个关键字结束:errorcode[reason]pass(4)lookup表示在缓存里查找被请求的对象,并且根据查找的结果把控制权交给函数vcl_hit或者函数vcl_miss。(5)vcl_hit函数在执行lookup指令后,如果在缓存中找到请求的内容,将自动调用该函数。此函数一般以如下几个关键字结束:deliver:表示将找到的内容发送给客户端,并把控制权交给函数vcl_deliver。errorcode[reason]pass(6)vcl_miss函数在执行lookup指令后,如果没有在缓存中找到请求的内容时自动调用该方法,此函数可以用于判断是否需要从后端服务器取内容。此函数一般以如下几个关键字结束:fetch:表示从后端获取请求的内容,并把控制权交给vcl_fetch函数。errorcode[reason]pass(7)vcl_fetch函数在从后端主机更新缓存并且获取内容后调用该方法,接着,通过判断获取的内容来决定是否将内容放入缓存,还是直接返回给客户端。此函数一般以如下几个关键字结束:errorcode[reason]passdeliver(8)vcl_deliver函数在缓存中找到请求的内容后,发送给客户端前调用此方法。此函数一般以如下几个关键字结束:errorcode[reason]deliver(9)vcl_timeout函数此函数在缓存内容到期前调用。一般以如下几个关键字结束:discard:表示从缓存中清除该内容。fetch(10)vcl_discard函数在缓存内容到期后或缓存空间不够时,自动调用该方法,一般以如下几个关键字结束:keep:表示将内容继续保留在缓存中。discard2、VCL处理流程图通过上面对VCL函数的介绍,读者对各个函数实现的功能已经有了一个了解,其实每个函数之间都是相互关联的,下图列出了varnish处理HTTP请求的一个运行流程图。处理过程大致分为如下几个步骤:(1)Receive状态,也就是请求处理的入口状态,根据VCL规则判断该请求应该是Pass或Pipe,或者进入Lookup(本地查询)。(2)Lookup状态,进入此状态后,会在hash表中查找数据,若找到,则进入Hit状态,否则进入miss状态。(3)Pass状态,在此状态下,会进入后端请求,即进入fetch状态。(4)Fetch状态,在Fetch状态下,对请求进行后端的获取,发送请求,获得数据,并进行本地的存储。(5)Deliver状态,将获取到的数据发送给客户端,然后完成本次请求。3、内置公用变量VCL内置的公用变量可以用在不同的VCL函数中,根据这些公用变量使用的不同阶段,下面依次介绍。当请求到达后,可以使用的公用变量如表2所示:表2公用变量名称含义req.backend指定对应的后端主机server.ip表示服务器端IPclient.ip表示客户端IPreq.request指定请求的类型,例如GET、HEAD、POST等req.url指定请求的地址req.proto表示客户端发起请求的HTTP协议版本req.http.header表示对应请求中的http头部信息req.restarts表示请求重启的次数,默认最大值为4Varnish在向后端主机请求时,可以使用的公用变量如表3所示:表3公用变量名称含义beresp.request指定请求的类型,例如GET、HEAD等beresp.url指定请求的地址beresp.proto表示客户端发起请求的HTTP协议版本beresp.http.header表示对应请求中的http头部信息beresp.ttl表示缓存的生存周期,也就是cache保留多长时间,单位是秒从cache或者后端主机获取内容后,可以使用的公用变量如表4所示:表4公用变量名称含义obj.status表示返回内容的请求状态代码,例如200、302、504等obj.cacheable表示返回的内容是否可以缓存,也就是说,如果HTTP返回是200、203、300、301、302、404、410等,并且有非0的生存期,则可以缓存obj.valid表示是否是有效的HTTP应答obj.response表示返回内容的请求状态信息obj.proto表示返回内容的HTTP协议版本obj.ttl表示返回内容的生存周期,也就是缓存时间,单位是秒obj.lastuse表示返回上一次请求到现在的间隔时间,单位是秒对客户端应答时,可以使用的公用变量如表5所示:表5公用变量名称含义resp.status表示返回给客户端的HTTP状态代码resp.proto表示返回给客户端的HTTP协议版本resp.http.header表示返回给客户端的HTTP头部信息resp.response表示返回给客户端的HTTP状态信息在上面的讲述中,我们只是介绍了常用的VCL内置公用变量,如果需要了解和使用更多的公用变量信息,请登录varnish官方网站查阅。三、配置一个简单的Varnish实例由于版本的不同,Varnish配置文件的写法也存在一定差异,varnish2.x版本和1.x版本之间不但配置文件写法不同,而且新的版本功能也增加很多,并且去除了很多应用BUG,这里讲述的版本是varnish2.1.2,配置文件写法也以varnish2.x版本为基准。Varnish安装完成后,默认的配置文件为/usr/local/varnish/etc/varnish/default.vcl,此文件内容默认全部被注释掉了,这里,我们以这个文件为模板,创建一个新的文件vcl.conf,并且放到/usr/local/varnish/etc目录下,配置完成的vcl.conf文件如下:#通过backend定义了一个名称为webserver的后端主机,“.host”指定后端主机的IP地址或者域名,“.port”指定后端主机的服务端口。其中,“192.168.12.26”就是后端的一个web服务器。backendwebserver{.host=192.168.12.26;.port=80;}#调用vcl_recv开始。subvcl_recv{