VNX性能日常监控及巡检一、VNX性能收集1、打开管理控制台system-monitoringandalters2、选择statisticsforblock3、点击performancedatalogging弹出对话框,在stopautomaticallyafter填写信息收集的天数,最少1天,最多7天,然后点击start。再定义的天数之后收集工作自动停止4、获得日志,点击Retrievearchive弹出对话框,选择收集的日志(可根据日期来确定),然后选择retrieve到本地电脑上二、VNX性能分析1、存储各部件性能分析关注点:SP:Utilization,dirtypages,watermarksLUN:Ownership,forcedflushes,throughput,I/OsizeDISK:IOPs,MB/s,ServiceTime,QueueLengths2、存储性能监控点:LUNUtilization:50%ResponseTime:10msAverageQueueLength:(视具体情况而定)ForcedFlushes:10/s3、性能参数详解Utilization:利用率。对于存储来说,SP的利用率不差过70%,LUN的利用率不超过50%,那么我们认为该部件不存在性能问题。Watermarks:存储写内存的一个水位线参数,用于管理writecacheflushing。EMCVNX存储默认的水位线为60%-80%。当cacheusage超过80%,就会触发forcedflushes。最佳状态是没有forcedflushes,如果当每秒forcedflushes数量超过10次,就存在性能问题。当cacheusage长期低于60%,说明cacheusage过低,可以通过适当的提高内存的利用率来提高性能。ResponseTime:RT=ServiceTime*Queuedepth一般我们认为LUN的RT低于10ms,该设备没有性能问题。IOPs:对于VNX存储常用的磁盘类型,我们粗略定义如下:SAS15krpm180SAS10krpm150NL-SAS7.2krpm90当我们发现存在性能问题时,我们检查磁盘的IOPs,如果磁盘非常繁忙,IOPs接近磁盘的理论上限,那么我们初步认为,目前的磁盘数量配置已经不能满足应用需求,需要扩容更多的磁盘。LUNOwnership:由于VNX存储的架构,每个LUN在某一时刻只能属于一个SP。故我们建议在创建LUN的时候手工将LUNOwnership平分到2个SP控制器上。当存储发现2个控制器的工作压力不平均或有一个控制器发现故障时,会切换LUN的ownership。正常切换不会影响生产应用和性能。但是如果发现非正常切换,例如短时间内一个LUN反复在2个SP上来回切换,这将导致严重的性能问题。LUN的ownership切换可以在存储的log里查看。三、VNX日常巡检1、登录到VNX5500的ControlStation,打开初始界面,在Dashboard上面可以查看部分告警信息及系统信息:2、也可以在system目录下选择MonitoringandAlerts,查看关于文件系统或者后端存储的事件信息:3、查看后端存储SP的事件日志:4、查看文件系统的事件日志:5、查看后端存储的故障信息:6、查看后端存储的主机连接信息:7、查看后端存储的LUNTrespass信息:8、若有故障需要深入分析还需要获取存储上的诊断信息:生成方法如下图示:9、上传生成的诊断信息到本地:如有需要在传给EMCsupport