基于模糊聚类分析方法在人员考核中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1基于模糊聚类分析方法在人员考核中的应用摘要:本文介绍了模糊聚类分析方法的基本原理,并将这一方法应用于人员考核工作中。文中首先介绍了模糊聚类的思想,步骤和方法,然后对模糊聚类分析方法进行归纳,最后通过一个实例运用聚类相关的科学方法进行聚类演算,并做出聚类分析。这为人员考核提供了一种更为科学和客观的分类方法,具有理论和现实意义。关键字:模糊聚类;人员考核;传递闭包引言:当今社会的竞争归根结底是人才的竞争,在企业中对人员的考核是关键一环,目前对于人员考核普遍采用的方法是根据德、勤、技、能等所占不同的百分比,最后得到一个人员的考核总分。然后按照考核分数进行排序,根据排名评出优秀、良好、合格、基本合格和不合格。这种方法在某种程度上说具有一定的合理性,但也存在着很多弊端。由于在人员考核中存在许多的不确定因素和复杂的因果关系,因而采用聚类的方法研究对象加以分类就显得更客观合理。然而,通常所采用系统聚类法难以准确度量样本间的相似程度并且难以正确选取最优聚类的截取水平。这种聚类具有非此即彼的特性,样本只可能隶属于所划定类别中的一类,这种分类类别界限清晰的特点并不适用于现实生活中样本的模糊归属特性,即样本并不是一定隶属于某一类别,而是可能位于两类或者多个类别之间。因此采用模糊聚类的方法对人员进行分类就显得更客观合理。1模糊聚类的思想,步骤及方法聚类问题的研究不仅仅局限于硬聚类,即每一个数据只能被归为一类,模糊聚类也是聚类分析中研究较为广泛的一个分支。模糊聚类分析对象是尚未分类的群体,基本思想是指用相似性尺度来衡量事物之间的相近程度,并由此来实现聚类,模糊聚类分析的实质就是根据研究对象本身具有的属性来构造模糊矩阵。相对于硬聚类,模糊聚类并非将一个数据归为唯一一类,而是通过隶属函数来确定每一个数据隶属于各类的程度。目前也已提出许多有关模糊聚类的算法,其中比较著名的有模糊C-平均(FCM)等。模糊聚类是以模糊集合理论为基础的,模糊集合理论是研究和处理模糊性现象的理论基础。所谓模糊性主要指客观事物的差异在中间过渡时所呈现的“亦此亦彼”性。模糊集论与传统的集合论密切相关。集合可以表现概念,集合的运算和变换可以表示判断与推理。在普通集合论中,一个对象对于一个集合要么属于要么不属于,二者必居其一且仅居其一,绝不2能模棱两可,这一条要求限定了普通集合论只能表现“非此即彼”的现象。模糊聚类的基本方法有(1)基于模糊划分概念的模糊聚类方法,如传递闭包法;(2)基于模糊相关关系的直接聚类法,如最大树法,编网法等;(3)模糊C-划分方法。其中,最著名的是模糊C-平均聚类(FCM)算法,它是最常见的基于目标函数最小化的聚类算法。模糊聚类分析方法的步骤一般可以归结如下:(1)建立原始数据矩阵设待分类的n个样本为X={x1,x2,x3,x4,x5…Xn},每个样本有m个特征,记为xi={xi1,xi2,…xim},(i=1,2,3,4….n).于是得到原始矩阵,其中,xnm表示第n个分类对象的第m个指标的原始数据。(2)数据标准化由于原始数据具有不同的数量级,所以对原始数据进行标准化处理,排除原始数据中不同变量间量纲的影响。为了使不同量钢能够进行分析和比较,通过需要对数据进行标准化变换,将数据压缩到[0,1]区间,常见的变换方式是先做平移-标准差变换,Xij`=𝑥𝑖𝑗`=𝑥𝑖𝑗−𝑥𝑖𝑠𝑗,{其中𝑥𝑗̅=1𝑛∑𝑥𝑖𝑗𝑛𝑖=1,𝑠𝑗=√1𝑛∑(𝑥𝑖𝑗−𝑥𝑗̅)^2,(j=1,2,……)}再做平移-极差变换𝑥𝑖𝑗`=𝑥𝑖𝑗−min⁡{𝑥𝑖𝑗}max⁡{𝑥𝑖𝑗}−min⁡{𝑥𝑖𝑗}.(1≪𝑖≪n,j=1,2,3….m)(3)建立模糊相似矩阵针对上述的标准化矩阵,计算各分类对象间的相似程度,从而建立模糊相似矩阵,引入相似系数rij,R=(rij)n×m,这个过程又称为标定,计算标定的方法是很多的,主要包括三大类方法:①相似系数法;②距离法;③主观评分法。三类方法各有不同的适用范围,不同的问题需要的方法是不一样的。(4)模糊聚类分析对于上述的模糊相似矩阵R=(rij)n×m,可采用各种不同的方法来求解模糊等价矩阵,主要包括三大类方法:①基于模糊等价矩阵的聚类方法,主要是传递闭包法和Boole矩阵法;②基于模糊相似关系的直接聚类法,主要包括最大树法和编网法;③基于模糊C-划分的模糊聚类法。本文中为了算法的方便,采用了第一类方法。32模糊聚类在人员分析中的实现确定数据统计指标我们选择8名人员作为考核对象,从思想素质、业务水平、工作量、科研成果四个方面进行考核(四个方面的百分比为10%、30%、35%、25%)。8名人员组成一个分类集X=(𝑥1,𝑥2,𝑥3,𝑥4,𝑥5,𝑥6,𝑥7,𝑥8),𝑋𝑖𝑗={𝑥𝑖1𝑥𝑖2𝑥𝑖3𝑥𝑖4},这里𝑥𝑖𝑗表示第i名人员第j个方面指标。对8名人员进行打分得到U上的8个模糊子集Xi(i=1,2,…8):X1=(7570636065)𝑋2=(9080788095)𝑋3=(8787757695)𝑋4=(5850556055)𝑋5=(7075606372)𝑋6=(7065656970)𝑋7=(8590807890)𝑋8=(9290758590)(1)建立原始数据矩阵Ω=(0.100.300.350.25)首先对原始数据进行加权预处理得到数据矩阵7.517.518.915.09.020.023.420.08.721.822.519.0D1=5.812.516.515.07.018.818.015.87.016.319.517.38.522.524.019.59.222.522.521.3(2)数据标准化为了使不同量钢能够进行分析和比较,通过需要对数据进行标准化变换,将数据压缩到[0,1]区间。常见的变换方式是先做平移-标准差变换𝑥𝑖𝑗`=𝑥𝑖𝑗−𝑥𝑖𝑠𝑗,{其中𝑥𝑗̅=1𝑛∑𝑥𝑖𝑗𝑛𝑖=1,𝑠𝑗=√1𝑛∑(𝑥𝑖𝑗−𝑥𝑗̅)^2,(j=1,2,……)}-0.281546926-0.42645-0.63306-1.178210.9697727450.2902710.983260.8797950.7195088110.8063090.6599960.4681954⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡𝑥𝑖𝑗=-1.69970922-1.85989-1.49509-1.17821-0.698653483-0.05375-0.95632-0.84893-0.698653483-0.77047-0.41755-0.231530.5526661881.006991.1987690.6739951.1366153681.006990.6599961.414875这样得到的𝑥𝑖𝑘‘不一定在[0,1]区间上,为了把数据压缩到[0,1]上,再做平移-极差变换𝑥𝑖𝑗`=𝑥𝑖𝑗−min⁡{𝑥𝑖𝑗}max⁡{𝑥𝑖𝑗}−min⁡{𝑥𝑖𝑗}.(1≪𝑖≪n,j=1,2,3….m)0.50.50.3200.9411764710.750.920.7936510.8529411760.930.80.634921𝑥𝑖𝑗`=00000.3529411760.630.20.1269840.3529411760.380.40.3650790.794117647110.714286110.81(3)用最大最小法建立相似矩阵依据标准化的数据建立模糊相似矩阵,引入相似系数𝑟𝑖𝑗,这里𝑟𝑖𝑗表示𝑟𝑖和𝑟𝑗之间的相似程度。采用最大最小法来计算𝑟𝑖𝑗,其计算公式为:𝑟𝑖𝑗=∑min⁡(𝑥𝑖𝑘,𝑥𝑗𝑘)𝑚𝑘=1∑max⁡(𝑥𝑖𝑘,𝑥𝑗𝑘)𝑚𝑘=1其中𝑟𝑖𝑗∈[0,1],1≪𝑖,𝑗≪𝑛.将表中标准化数值代入上述公式,得相似矩阵5(4)聚类分析(传递闭包法)矩阵R是模糊相似矩阵满足自反性和对称性,但不具有传递性,为了进行分类,要对R进行改造,求其传递闭包t(R)。依据下述定理定理设R是n阶模糊相似关系,则存在一个最小的自然数k(k≤n),使得R的传递闭包t(R)=𝑅𝑘,且对一切大于k的自然数l,恒有𝑅𝑙=𝑅𝑘。由平方法求解传递闭包,经过多次运算可得10.804890.8048990.7965370.6744350.8442760.8048990.8056090.80489910.9775670.7965370.6744350.8048990.9935470.8048990.8048990.97756710.7965370.6744350.8048990.9775670.804899t(R)=𝑅8=0.7965370.7965370.79653710.6744350.7965370.7965370.79653⁡=𝑅40.6744350.6744350.6744350.67443510.6744350.6744350.6744350.8442760.8048990.8048990.7965370.67443510.8048990.8056090.8048990.9935470.9775670.7965370.6744350.80489910.8048990.8056090.8048990.8048990.7965370.6744350.8056090.8048991根据模糊等价关系矩阵即可对8名销售员进行聚类分析。令𝜆由1降至0,按𝜆截距进行动态聚类。当0.993547𝜆≤1时,t(R1)=|||1⁡0⁡0⁡0⁡⁡0⁡0⁡0⁡00⁡1⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡1⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡1⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡1⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡1⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡1⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡0⁡1⁡|||X被分为8类:{x1},{x2},{x3},{x4},{x5},{x6},{x7},{x8}同理当0.977567𝜆≤0.993547时,X被分为7类:{x1},{x3},{x2,x7},{x4},{x5},{x6},{x8}当0.844276𝜆≤0.977567时,X被分为6类:{x1},{x2,x3,x7},{x4},{x5},{x6}当0.805609𝜆≤0.844276时,X被分为5类:{x1,x6},{x2,x3,x7},{x4},{x5},{x8}当0.804899𝜆≤0.805609时,X被分为4类:{x1,x2,x3,x6,x7,x8},{x4},{x5}当0.796537𝜆≤0.804899时,X被分为3类:{x1,x2,x3,x7,x8},{x4},{x5}6当0.674435𝜆≤0.796537时,X被分为2类:{x1,x2,x3,x4,x6,x7,x8},{x5}当0𝜆≤0.674435时,X被分为1类:{x1,x2,x3,x4,x5,x6,x7,x8}由上述平方法求解可知,传递闭包为t(R)=𝑅4,它是模糊等价关系矩阵,用其可对8个人员进行聚类分析。第一,二,三种分法,分类太细,8名人员基本各自成类,它过分强调人员在四个指标上的差异,而没有注意到指标的相互影响关系,没有起到分类作用,后面三种分法,又几乎忽视了7个学生在成绩上表现出的各种差异,分类太粗;中间的两种算法比较可取,以第五种分法为例,分为四类(优,良,中,差),通过分析可以看出第1,6,8人员为一类,2,3,7为一类,4,5各自为一类,通过比较可知,2.3.7总体相对较优,1.6.8其次,5居中,4最差。3总结很多聚类分析方法是实现对数据对象“硬划分”的目的,它把每个待聚类的对象严格地划分到某个类中,体现了非此即彼的性质,因此这种聚类的类别界限是分明的。然而在实际生活中有许多方面遇到的聚类问题,如环境污染的分级,种植区域的划分,疾病的分类

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功