1.正态分布的性质:①μ与Σ对分布起决定作用P(X)=N(μ,Σ),μ由n个分量组成,Σ由n(n+1)/2元素组成。所以多维正态分布由n+n(n+1)/2个参数组成。②等密度点的轨迹是一个超椭球面。区域中心由μ决定,区域形状由Σ决定。③不相关性等价于独立性。若xi与xj互不相关,则xi与xj一定独立。④线性变换的正态性Y=AX,A为线性变换矩阵。若X为正态分布,则Y也是正态分布。⑤线性组合的正态性。2.Bayes分类的算法(假定各类样本服从正态分布)①输入类数M;特征数n,待分样本数m.②输入训练样本数N和训练集资料矩阵X(N×n)。并计算有关参数。③计算矩阵X中各类的后验概率。④若按最小错误率原则分类,则可根据3的结果判定y中各类样本的类别。⑤若按最小风险原则分类,则输入各值,并计算X中各样本属于各类时的风险并判定各样本类别。3.基于最小风险的贝叶斯决策4.最小错误率贝叶斯决策规则与N-P决策聂曼——皮尔逊决策规则与最小错误率贝叶斯决策规则都是以似然比为基础的,所不同的只是最小错误率决策所用的阈值是先验概率之比P(ω2)/P(ω1),而聂曼——皮尔逊决策所用的阈值则是Lagrange乘子。5.最小最大决策:如果对给定的x,其P(ωi)不变,按照贝叶斯决策规则,可以使错误率最小或风险最小。但如果P(ωi)是可变的,或事先对先验概率毫无所知,若再按某个固定的P(ωi)条件下的决策规则来进行决策就往往得不到最小错误率或最小风险。最小最大决策讨论在P(ωi)变化时如何使最大可能风险最小。6.ISODTA意为迭代自组织数据分析技术。这个算法与K均值算法相似,也是以均值迭代确定聚类中心,但它加进了人机对话环节,可以调整参数,并且引入了归并与分裂的机制,即当某两类别中心间距小于某一阈值时,将它们合并为一类,而在某类样本标准差大于某一阈值时,或其样本数目超过某一阈值时,则将它分为两类,在类别数目少于某一阈值时,也实行分裂。另外,在某类样本数目少于某阈值时,又需要将其消除。因此,这种方法灵活性更强,更为合理。该算法需要确定并在计算中可以调整的参数有:7.LMSE算法:前述迭代求解权向量的方法是在模式集线性可分的情况下采用的。但给出一个模式集往往不能预先告知是否线性可分,LMSE算法就是针对这一问题对准则函数引进最小平方误差而建立起来的,它可以在训练过程中判定训练模式集(样本集)是否线性可分,因而可以判断权向量求解的收敛性。8.叙述利用K—L变换进行分类特征提取的基本思想,以类内散布矩阵为例说明其提取步骤它是各类模式协方差矩阵之和。若采用这种矩阵作K-L变换,从分类的角度出发,一般希望各类模式的类内距离最小,即要求其凝聚程度要好,因此常选用较小本征值对应的本征向量组成变换矩阵计算类间散布矩阵的本征值,按其大小排列,选择对应于较大本征向量构成变换矩阵,就可以得到有利分类的降维后的新模式。