IRF2技术原理与应用实践日期:杭州华三通信技术有限公司版权所有,未经授权不得使用与传播构建H3C数据中心网络ConstructingH3CDataCenterNetwork,CHDCN交换网络面临越来越高的要求,其可靠性、可用性、可管理性等都面临越来越高的挑战H3CIRF2技术能够有效提高交换网络的多方面性能引入描述IRF2的优势描述IRF2主要名词术语理解IRF2的基本工作原理在数据中心环境中执行基本的IRF2配置课程目标学习完本课程,您应该能够:IRF2技术原理IRF2基础配置目录高性能交换网络的需求高可靠性快速收敛充分利用链路和端口等资源降低部署和维护的难度介绍IRF2(IntelligentResilientFrameworkII,第二代智能弹性架构)是H3C研发的软件虚拟化技术IRF2允许将多台设备连接在一起,形成一个IRF2堆叠一个IRF2堆叠相当于一台“虚拟设备”IRF2堆叠中的主设备和从设备保持配置和运行状态同步,实现1:N备份,保证高可靠性可实现多台设备的协同工作、统一管理和不间断维护堆叠一个IRF2堆叠的功能等效于一台虚拟的逻辑设备。其优点包括:简化管理提高性能弹性扩展高可靠性等效于虚拟设备IRF2堆叠优点一:提高资源利用率,获得更高性能使用IRF2后核心设备和汇聚设备工作在负载分担的方式接入到汇聚,以及汇聚到核心的双链路上行工作在负载分担方式使用IRF2前核心设备和汇聚设备工作在一主一备的方式接入到汇聚,以及汇聚到核心的双链路上行工作在一主一备的方式优点二:简化网络规划和管理二层启用生成树,VLAN规划复杂三层启用VRRP,路由规划复杂每台单独配置,管理复杂使用IRF2前路由路径使用IRF2后二层不需要生成树三层不需要VRRP多台设备只需配置一次,让网络更简单配置文件=10.153.108.1Gateway=10.153.108.1IP=10.153.108.3/24虚IP=10.153.108.1IP=10.153.108.2/24Gateway=10.153.108.1Gateway=10.153.108.1IP=10.153.108.1/24IP=10.153.108.1/24Gateway=10.153.108.1Gateway=10.153.108.1IRF2堆叠IP=10.153.108.1/24VRRPMSTPIRF2收敛时间主备切换时间从秒级降低到毫秒级优点三:降低故障中断时间网络层备份链路层备份物理层备份系列万兆XFP与SFP+光口或SFP+电缆互连,支持千兆端口互连;不支持COMBO口2一个IRF口最多绑定12个10GE/GE端口支持远程级联。S7500E系列万兆XFP端口互连,需要通过光纤直连4一个IRF口最多绑定8个10GE端口S5800/S5820系列万兆SFP+端口光模块或电缆互连9S5500EI/S5120EI系列支持万兆端口互连,可使用CX4堆叠电缆或光纤互连9设备连接每台设备只有2个IRF2逻辑端口Port1和Port2一台设备的Port1只能与另一设备的Port2相连一个IRF2逻辑端口可以由一个或多个IRF2物理端口构成由多个物理端口构成的逻辑端口也称为聚合端口逻辑端口物理连接Port1Port1Port2Port2Port1Port2Port1Port2聚合端口堆叠的拓扑IRF2堆叠拓扑有两种——链形拓扑和环形拓扑一个IRF2堆叠由一组相同型号的成员设备组成成员设备分为Master和Slave两种角色MasterSlaveSlaveSlaveIRF2堆叠IRF2堆叠MasterSlaveSlaveSlavePort1Port2Port1Port2Port1Port2Port1Port2Port2Port1Port1Port2Port2Port1IRF2以DomainID(域编号)来区分不同的IRF2堆叠只有DomainID相同的设备才可能加入同一IRF2堆叠MasterMasterSlaveSlaveIRF2堆叠1Port2Port1Port1Port2IRF2堆叠2DomainID=1DomainID=2协议热备份Master负责将协议的配置信息以及支撑协议运行的数据备份到其它所有成员设备IRF2堆叠能够像一台设备一样在网络中运行Master故障时,Slave可以立即取代之MasterSlaveSlaveSlaveIRF2堆叠OSPF备份信息备份信息OSPF备份信息备份信息分布式聚合技术IRF2采用分布式聚合技术来实现上/下行链路的冗余备份,可以跨设备配置链路备份MasterSlaveSlaveSlaveIRF2堆叠堆叠报文转发IRF2采用分布式弹性转发技术实现报文的二/三层转发,最大限度地发挥每个成员设备的处理能力各成员设备自动选择IRF2堆叠内部最佳路径来转发报文,以获得最佳性能MasterSlaveSlaveSlaveIRF2堆叠转发报文转发报文转发报文成员编号(MemberID)在IRF2中以成员编号(MemberID)标识设备各设备成员编号必须唯一在配置IRF2前,需要规划好每台设备的成员编号,并分别在设备上进行配置配置IRF端口和优先级也是根据设备的成员编号来进行的,修改后的成员编号需要重启才能生效成员编号存储在设备非易失介质中修改设备成员编号可能导致设备配置发生变化或丢失Master的MemberID也称为ActiveID集中统一管理用Console口或者Telnet方式登录到IRF2堆叠中任意一台成员设备,都可以对整个IRF2堆叠进行管理和配置,就像配置一台设备。Master统一配置用户无论使用什么方式,通过哪个成员设备登录IRF2堆叠,最终都是通过Master设备进行配置,这种方式可以使IRF2堆叠内所有设备的配置保持高度统一。成员编号唯一成员编号被引入到端口编号中,便于用户配置和识别成员设备上的端口。MemberID1的Gigabitethernet4/0/2报文IRF2设备由IRF2端口发送并接收Hello报文相邻成员设备之间交互Hello报文来收集整个IRF2堆叠的拓扑关系IRF2成员设备在本地记录已知的拓扑信息拓扑信息收集完成后,会进入角色选举阶段,确定成员设备角色经过一段时间的收集,所有设备上都会收集到完整的拓扑信息,称为拓扑收敛MasterSlaveSlaveSlaveIRF2堆叠HelloHelloHelloHelloHelloHelloHelloHello•域编号•成员编号•优先级•桥MAC地址•连接关系•启动时间Hello报文携带:优先级相同?系统运行时间相同?Y优先级大者成为Master系统运行时间长者成为Master对S75E及低端交换机,成员桥MAC地址小的优先对S125/95E系列,成员编号小的优先NNY当前是否存在唯一的Master?开始YN=1Priority=5MemberID=2Priority=1IRF2堆叠新加入设备通过逐跳Hello通知其他设备SWASWBSWDHello,Master已经存在他的MemberID=1,Priority=5Hello,我刚启动IRF我的MemberID=3,Priority=1不用重启,直接加入,成为Slave213=1Priority=5MemberID=2Priority=1IRF2堆叠新加入设备通过逐跳Hello通知其他设备SWASWBSWCHello,我是Master我的MemberID=1,Priority=5Hello,我是Master我的MemberID=4,Priority=1对方优先成为Master。我重启后成为Slave123MasterMasterSlaveIRF2堆叠SWASWBSWCSlave=1Priority=5MemberID=2Priority=1MemberID=3Priority=1SlaveMasterIRF端口DownSWASWBSWCHelloMaster,与Member3失去联系2Hello,知道了3MasterSlaveMemberID=1Priority=5MemberID=2Priority=1MemberID=3Priority=1SWASWBSWC成员设备IRF端口Down,则相应成员设备马上通过广播通知其余设备修改拓扑1IRF2堆叠IRF2堆叠IRF2堆叠=4Priority=150个周期未收到HelloSWASWBSWCMemberID=1Priority=5MemberID=2Priority=11MasterSlaveMasterMemberID=4Priority=1关闭端口SWASWBSWCMemberID=1Priority=5MemberID=2Priority=1HelloMaster,明白5Hello,与Member4失去联系,更新拓扑43出现故障,与Member4失去联系2Hello报文的周期为200ms成员设备IRF端口50个周期未收到邻居的Hello报文时,IRF2堆叠会删除此设备并更新拓扑IRF2堆叠IRF2堆叠IRF2堆叠=4Priority=1SWASWBMemberID=1Priority=5IRF2堆叠IRF2堆叠MasterSlaveMemberID=4Priority=1SWASWCSWBMemberID=1Priority=5IRF2堆叠SWC我的地址是10.1.1.1我的地址是10.1.1.1我的地址是10.1.1.1分裂后产生的两个IRF堆叠拥有相同的IP地址等三层配置,从而引起冲突检测IRF2采用MAD(Multi-ActiveDetection,多Active检测)解决分裂后的冲突问题使Master成员编号最小的堆叠维持Active状态(正常工作状态)使其它堆叠迁移到Recovery状态(禁用状态),并关闭其成员设备上除保留端口以外的其它所有物理端口(通常为业务接口)MAD检测的三种方法基于LACP的MAD检测基于BFD的MAD检测基于ResilientARP的MAD检测检测扩展LACP消息携带ActiveIDActiveID大的一方竞争失败,迁移到Recovery状态要求相邻的交换机必须为支持此检测特性的H3C设备Ma