模式识别第五章:统计模式识别中的聚类方法1.请简述几种聚类准则函数。(1)误差平方和(2)权平均平方距离和(3)类间距离和(4)离散度-基于迹、行列式、特征值2.聚类算法可分为哪几类?影响聚类算法性能优劣的因素有哪些?(1)增类聚类算法(基于分裂的聚类算法)(2)减类聚类算法(基于合并的聚类算法)(3)动态聚类算法因素:聚类中心的选择与更新、聚类策略和聚类准则的选择、控制阈值和类别数的设置等3.请给出C-均值聚类算法的流程图。书上第196~203页初始化:类别计数器类间距离阈值T=充分大的数迭代计数器k=0(1)计算各样本间的欧式距离,构造矩阵D6.已知一个样本集合:试用近邻函数法进行聚类分析(1)计算距离矩阵D{(0,0),(1,1),(2,1),(4,4),(5,3),(5,4),(6,3),(6,5)}tttttttt(3)计算近邻函数值矩阵7.请给出最下张树聚类算法的具体过程,并分析其优缺点。课本第218~221页优点:简洁、明快,特别适用于距离较远的两个密集样本点集之间的区分。缺点:1)当样本集合中存在噪声样本时可能造成错分2)对于相距较近的两个密集样本点集的区分能力较弱。