基于蚁巡的大数据运维解决方案山东蚁巡网络科技有限公司•我们希望可以利用我们提供的产品及服务,来帮助用户更好的利用起自己的IT资源。我们通过收集和分析机器数据来展现出IT资源的健康程度、是否存在问题及问题症结所在,从而达到帮助用户了解自己的IT资源,避免资源故障,并更好的利用这些资源来发展自己。•公司旗下的“蚁巡”系列运维产品已应用于政府、企业、高校、军工及众多国家级项目,为各行各业的IT信息化建设发挥了重要作用。公司在运维工具研发、大数据运维管理、运维云平台建设方面均处于国内领先水平。公司介绍大数据运维的困扰•管理超大量的设备-几百至几千台的服务器•集群监控困难•虚拟化的管理不便•开源的软件平台/缺乏良好的监控手段大数据案例介绍•蚁坊软件是一家专业从事互联网大数据分析的软件企业。蚁坊软件拥有自主品牌的大数据处理平台:蚂蚁工厂(Antfact),专注于大数据信息挖掘的价值传递。•蚁坊软件的大数据处理平台蚂蚁工厂分布在两个数据中心,一个位于长沙软件园内海量数据处理工厂研究中心,另一个位于国防科大天河机房。两个数据中心的节点数已经超过500个。超大量的设备自动发现设备发现·扫描网络中设备·自动识别设备的类型和操作系统应用发现·基于网络指纹应用的识别网络拓扑·显示当前的网络结构,可发现二级交换机性能监控性能监控BigDataHadoopCassandraSolrRedisCamelNeo4J性能监控•通过界面直接观测出大数据集群的负载是否均衡•服务器有没有被充分利用起来?•当有人申请增加服务器时,是否真的有增加的必要?对长时间的数据做性能分析•12月1日前运行不稳定•12月1日有一次系统升级•升级后性能提升,并运行稳定•一个月的时间,硬盘空间增长了约7%•可以初步预测,三个月后硬盘空间会超过85%,需要对硬盘进行扩容虚拟化监控虚拟化监控•物理机上哪一台设备占用的资源最多?•要新增的虚拟机应该分配到哪个物理机上?统计报告•机器的瓶颈在CPU?内存?硬盘?一目了然的统计报告统计报告•本周和上周相比系统运行稳定情况如何?通过蚁巡,可以把500个服务器用一种清晰、精确的方式展示给管理者。不同于一般的资产管理工具,蚁巡在做IT设备管理时把设备的自动发现、设备的监控融合到了一起,使得维护工作变得更加准确、更加简单,不再会出现人为的统计错误。通过蚁巡,蚁坊软件在设备的采购和维护从无序走向了有序,今年在蚁巡的监控下让500个服务器节点得到了充分利用,在IT建设上节省的投资达到了数百万元。总结谢谢