第五章聚类分析习题思考与习题5.1判别分析与聚类分析有何区别答:判别分析:就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。或者说,确定了某种标准,在类别已知的情况下,利用这种标准将它们区别开来。聚类分析:就是利用这些标准,在类别未知时,找出类别的个数,并将它们分别聚成为不同的类里。5.2试述系统聚类的基本思想答:就是距离相近的样品先聚成类,距离相远的后聚成类,过程一直进行下去,每个总能聚到合适的类中。5.5试叙述K均值法与系统聚类法的异同答:相同点:全是利用距离判别方法来计算样品间的距离,都以距离的远近亲疏为标准进行聚类。不同点:系统聚类法要计算出不同样品的距离,还要在聚类的每一步都要计算“类间距离”。K均值法是一种简化的快速的系统聚类法。系统聚类对不同的类数产生一系列的聚类结果,而K均值法只能产生指定类数的聚类结果。5.7检验某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11。试用最短距离法,重心法进行聚类分析。解:设6个样品为六类,G1,…,G6,利用最短距离法5.11及5.12式,D(0)计算结果为1G2G3G4G5G6G1G02G103G2104G54305G876306G1098520D(0)中的最小元素是D12=D23=1,将G1,G2和G3合并成G7,构成D(1)7G4G5G6G7G04G305G6306G8520D(1)中的最小元素是D56=2,将G5和G6合并成G8,构成D(2)7G4G8G7G04G308G630D(2)中的最小元素是D74=D48=3,将G7,G4和G8合并成G9,这样六个样品就聚为一类。重心法:利用5.17及5.18式,欧几里得距离得,计算结果为1G2G3G4G5G6G1G02G103G4104G2516905G644936906G10081642540)0(2D中的最小元素是D12=D23=1,将G1,G2和G3合并成G7,构成其中p=1,q=2,s=3和r=7类,qsrsqpsrsppqrqpksrskqrqkprpkrDnnnDnnnDnnnDnnDnnDnnD2222222222)1(2D)0(2D2)312111(31)(12ssqqpprrXnXnXnnXsqprnnnn232132122322212919191313131DDDDDDkkk例如,k=4232132122432422412472919191313131DDDDDDD1696350191491191931163125317G4G5G6G7G04G1605G49906G121.52540例如,k=5:232132122532522512572919191313131DDDDDDD4932314996363149316431例如,k=6:232132122632622612672919191313131DDDDDDD5.121323245966431813110031D(1)中的最小元素是D56=4,将G5和G6合并成G8,构成D(2)7G4G8G7G04G1608G83.25150562462452842212121DDDD154212521921562762752872212121DDDD25.834215.121214921D(2)中的最小元素是D48=15,将G4和G8合并成G9,最后G9和G7并为一类,这样六个样品就聚为一类。结束