基于Linux集群技术的校园网络中心方案随着网络技术的发展和网络应用的进一步深入,校园网络承担了越来越多的来自教学、科研及管理方面的应用。校园网络中心作为校内局域网络的数据存储发布、流量的管理控制、用户的管理以及内外网络转接控制中心,必须解决因流量增加所带来的一系列问题。传统的网络中心方案中,当流量增加后,一般是升级单一的服务器系统,这往往会造成过高的投入和维护成本,极大地降低了性能价格比。运用基于Linux集群技术设计的校园网络中心方案可以有效地解决这一问题。校园网络中心体系结构基于Linux集群技术的校园网络中心的体系结构是以Linux核心层集群技术和安全技术为基石,构成的一个高可扩展、高可用和高安全的操作平台。其结构如图1所示。图1在这种体系结构下,网络中心的配置可以抽象分为负载均衡器、服务结点池和存储系统三个层次。1.负载均衡器这是集群的惟一入口,校园网络就是通过该设备接入Internet的。从校园内的单个客户端来看,集群通过这一层的服务体现为一个基于IP地址的单一系统映像(SSI),整个校园网络共用这个虚拟地址,通过它客户端可以把整个集群看作一个独立的具有合法IP地址的主机系统,客户端的所有访问都发往这个虚拟IP地址,可以有效地解决学校IP地址的短缺问题。如果仅有一台负载均衡器,容易造成负载均衡器的单点失效,使其成为集群中最脆弱的环节。因此,有必要提供容错机制,能够在负载均衡器失效的时候进行自动检测并平滑替换。在该方案中提供了一个备份负载均衡器,可以实时地监控负载均衡器的运行状态,并根据检测到的状态做出报警、接管、恢复等响应。2.服务结点池方案中的服务结点池指的是提供实际服务的服务器群。客户端发出的服务请求经过均衡器处理以后,转交到服务结点池由具体的服务器响应请求并返回数据。在校园网络中一般提供、FTP、邮件和课件点播等服务,使用单一的服务器系统无法应付高峰时的数据访问,通过多台服务器分担这些负载是比较经济可行的。服务器结点也有可能会出现暂时失效的情况,特别是在结点提供多种服务的时候,系统的随机故障或外部环境的突变都可能造成该节点的某个服务暂时不可用。这需要由负载均衡扩展出的容错机制识别出这种错误并及时进行处理,当错误排除后,集群能够自动识别恢复事件,把好的结点重新纳入集群继续运行。3.存储服务系统存储服务系统主要为整个集群内部运行提供稳定、一致的文件存取服务。该系统可以为集群节点池提供单一的文件系统入口,即在每一台服务结点上都共用同一个根;并且自动完成不同结点访问文件系统所引发的文件锁定、负载均衡、容错、内容一致、读写事务等底层功能,对应用层提供一个透明的文件访问服务。这种基于Linux集群技术构成的系统属于松耦合集群系统,不需要在集群中部署特殊的中间件层或者OS扩展,对服务器结点OS的兼容性比较好。这样构成的网络中心,基本上可以兼容多数的IP应用,不需要做复杂的移植和安装工作,每个具体的应用都可以看成相对独立的服务器系统。即使在负载均衡器上,核心功能也是透明地提供给用户的,不影响本机正常的网络应用。校园网络中心的关键技术这种网络方案所运用的技术,实际上是借助于网络接入协议层的负载均衡技术,将网络请求化整为零,由大量集群的服务结点来共同分担,以实现性能最大化的一项集群技术。因此该方案的关键技术是网络接入协议层的负载均衡技术。这种的负载均衡技术特点是:1.执行效率高。因为基于底层的协议,可以通过硬件体系进行部署,也可以在OS的核心层实现。2.兼容性强。接入协议往往能够兼容大多数现有的主流网络应用,比如IPv4体系中的IP层。3.体系实现相对简单。比起基于内容的高层交换,它不需要复杂的模式匹配机制,主要通过端口映射进行数据交换,规则简单。从根本上讲,该负载均衡技术的实现基础是IP交换,只是在Linux平台下IP的交换具备了一定的可扩展性,可以实现高性能、高可扩展性、易管理性等诸多特点,成为一个以负载均衡为核心的真正意义的集群系统。该Linux下支持三种负载均衡模型,分别是:地址转换(NAT)、IP隧道(IPIP)和直接路由(DR)模型。NAT是通过内部IP地址,将服务结点池同互联网隔离开来。服务结点和客户端不能直接通信,不论是请求数据还是应答数据,都需要经过负载均衡器进行IP包处理工作。IPIP采用的是开放的网络结构,服务结点拥有合法的互联网IP地址,可以通过路由路径将应答包直接返回给客户端。负载均衡器收到客户端的请求包后,通过IPIP协议为该IP包重新处理,形成以选定的服务结点为目的IP的新的IP包,原有的IP包数据则封装在新的IP包里。服务结点收到均衡器发来的IPIP数据后,将该包解开,根据其内的客户端地址(源地址)将处理结果直接返回给客户端,而应答包的源地址则成为集群的虚拟地址VIP。DR模式的工作方式是负载均衡器接收到客户端请求后,选择合适的服务结点,然后改写该请求包的MAC地址部分,使之成为目的服务结点的MAC地址,再将此包广播到均衡器所在的网段。由于每个服务结点都拥有一个虚拟的网络设备,这些设备上绑定了和均衡器一样的VIP,只是该设备并不响应对VIP的RAP解析,不会和均衡器的Vip地址冲突。负载均衡器收到符合自身MAC的IP包后,经过处理后直接将应答数据返回给客户,而此时的源地址仍然是VIP。这样,在客户端看来,访问的和接受响应的始终是集群的VIP地址了。在三种负载均衡模型中,NAT是双工连接处理模型,要对进入和流出集群的网络包进行改写包头地址的工作,在负荷比较重的时候会影响整个集群的性能,负载均衡器容易成为瓶颈;IPIP和DR是一种单工模型,负载均衡器仅仅处理进入集群的IP请求包,而对IP的应答数据则不处理,对于大量的返回数据,都由服务节点通过路由器、交换机等设备直接返回给客户端,具有较强可扩展性。但使用NAT模型在网络的安全性方面具有较强的优势。在校园网络中究竟选择那种选择那种负载均衡模型要根据网络的流量和具体的应用进行考虑。如果你只拥有一个合法的IP地址,或者你需要构造一个安全的集群,又不太担心性能问题的话,完全可以使用NAT模式。一般来讲,在校园网络中,大多数的网络请求比较小,无非是一些URL页面请求、GET或者POST表单,或者就是某些指令等等,这些数据基本上在几百到几千个字节。而相反,Web中的应答数据通常很大,一个普通的Web页面也要几十KB,更何况在校园网络中返回的很多内容都是视频、音频流,加上日益疯狂的网络下载,大大增加了应答数据的流量。这种情况下使用IPIP或者DR模式是一个非常好的选择。基于Linux集群技术的校园网络中心的优势这种基于Linux集群技术的校园网络中心方案相对于传统的单一服务器方案具有以下一些优势:1.可扩展性好校园网络的应用是根据计算机网络技术的发展和教师应用能力的提高而逐步深入的。任何一个网络中心的方案都不可能、也不需要一次性地把所有的应用考虑进去,因此系统的可扩展性就变得非常重要。使用该方案形成的网络系统,可以非常方便地扩充系统的功能。当校园网络中的应用增加后,系统的性格会下降,这时通过增加服务结点可以很方便地提高系统的性能,保证系统性能随着成本的增加而线性的增长。2.全天候的可用性支持在校园网络提供、FTP、邮件、课件点播和远程教学等服务后,全天侯的可用性就变得非常关键。该方案可以为网络的应用提供透明的、自动适应的可用性支持,这种独特的双机备份结构在服务结点发生故障后,可以自动切换或修复系统,保证24×7的系统正常运行。3.可管理性好随着校园网络应用的深入,网络系统的规模越来越庞大,系统管理的任务也越来越繁重。使用该方案可以有效地简化系统的管理,主要体现在:可以用基于HTTPS的Web管理界面和安全的命令行界面对网络进行管理;可以对系统中的所有节点都在一个单一控制点上进行配置和监控;可以对每一台服务器的状况进行实时的远程监控。4.安全性好这样构成的网络方案可以为服务器提供核心层的保护。在此基础上构建的防火墙集群系统,可以有效提高防火墙的性能和伸缩性,从而保证校园网络应用的安全性。5.相对的成本/性能优势构造这样的校园网络系统,在投入成本上是经济的,容易根据具体的需求定制合适价位的目标系统。