一、(15分)设有两类正态分布的样本集,第一类均值为T1(2,0),方差1111/21/2,第二类均值为T2(2,2),方差211-1/2-1/2,先验概率12()()pp,试求基于最小错误率的贝叶斯决策分界面。解根据后验概率公式()()()()iiipxppxpx,(2’)及正态密度函数11/21()exp[()()/2]2Tiiiinipxxx,1,2i。(2’)基于最小错误率的分界面为1122()()()()pxppxp,(2’)两边去对数,并代入密度函数,得1111112222()()/2ln()()/2lnTTxxxx(1)(2’)由已知条件可得12,114/34/3-2/3-2/3,214/34/32/32/3,(2’)设12(,)Txxx,把已知条件代入式(1),经整理得1221440xxxx,(5’)二、(15分)设两类样本的类内离散矩阵分别为11S11/21/2,21S1-1/2-1/2,各类样本均值分别为T1(1,0),T2(3,2),试用fisher准则求其决策面方程,并判断样本Tx(2,2)的类别。解:122SSS200(2’)投影方向为*112-2-1()211/2wS1/200(6’)阈值为*0122()/2-1-131Tyw(4’)给定样本的投影为*0-12241Tywxy,属于第二类(3’)三、(15分)给定如下的训练样例实例x0x1x2t(真实输出)11111212013101-14112-1用感知器训练法则求感知器的权值,设初始化权值为0120;1第1次迭代(4’)2第2次迭代(2’)3第3和4次迭代四、(15分)i.推导正态分布下的最大似然估计;ii.根据上步的结论,假设给出如下正态分布下的样本1,1.1,1.01,0.9,0.99,估计该部分的均值和方差两个参数。1设样本为K={x1,x2,…,xN},正态密度函数11/21()exp[()()/2]2Tiiiinipxxx(2’)则似然函数为121()(|)(,,...,|)(|)NNkklpKppθθxxxθxθ(2’)对数似然函数1()ln(|)NkkHpθxθ(2’)最大似然估计1ˆargmax()argmaxln(|)MLnkklpθθθθxθ(2’)对于正态分布11ˆNMLkkxN,2211ˆˆ()NMLkkxN(2’)2根据1中的结果11ˆ=1NMLkkxN,2211ˆˆ()=0.00404NMLkkxN(5’)五、(15分)给定样本数据如下:T(-6,-6),T(6,6)(1)对其进行PCA变换(2)用(1)的结果对样本数据做一维数据压缩解(1)PCA变换1求样本总体均值向量TTT=(-6,-6)(6,6)(0,0)2求协方差矩阵TT3636]/23636R=[(-6,-6)(-6,-6)(6,6)(6,6)(2’)3求特征根,令363603636,得172,20。(1’)由iiiR,得特征向量11/21,21/21(2’)则PCA为12662[,]662,12662[,]662(5’)(2)要做一维压缩,就是向最大特征根对应的特征向量做投影,得62,62(5’)六、(10分)已知4个二维样本:T1x(0,0),T2x(0,1),T3x(1,2),T4x(4,3)。试用层次聚类把样本分成2类。解:1初始将每一个样本视为一类,得011{}Gx,022{}Gx,033{}Gx,044{}Gx计算各类间的距离,得到距离矩阵0D,(2’)0D011{}Gx022{}Gx033{}Gx044{}Gx011{}Gx0155022{}Gx10225033{}Gx52010044{}Gx5251002将最短距离1对应的类011{}Gx,022{}Gx合并为一类,得到新的分类:(4’)1001212{,}GGG,1033{}GG,1044{}GG计算各类间的欧式距离,得到距离矩阵1D(2’)1D1001212{,}GGG1033{}GG1044{}GG1001212{,}GGG02251033{}GG20101044{}GG251003将距离最小两类1001212{,}GGG和1033{}GG合并为一类,得到新的分类2000123123{,,}GGGG,2044{}GG聚类结束,结果为1123{,,}xxx,24{}x(2’)七、(10分)已知4个二维样本:T1x(0,0),T2x(1,0),T3x(6,4),T4x(7,5),T5x(10,9)。取K=3,用K均值算法做聚类解:1K=3,初始化聚类中心,T11(1)zx(0,0),T23(1)zx(6,4),T35(1)zx(10,9)(2’)2根据中心进行分类,得112{,}xx,234{,}xx,35{}x(2’)3更新聚类中心,T112(2)()/2zxx(1/2,0),TTT234(2)()/2zxx(6,4)(7,5)(13/2,9/2),T35(2)zx(10,9)(4’)4根据新的中心进行分类,得112{,}xx,234{,}xx,35{}x,分类已经不再变化,因此最后的分类结果为112{,}xx,234{,}xx,35{}x(2’)八、(10分)设论域1234{,,,}Xxxxx,给定X上的一个模糊关系~R,其模糊矩阵为10.80.80.20.810.850.20.80.8510.20.20.20.21R(1)判断该模糊矩阵式模糊相似矩阵还是模糊等价矩阵(2)按不同的置信水平0.9,0.8给出分类结果解:(1)因为RRR(计算过程),是模糊等价矩阵(6’)(2)0.91000010000100001R,聚类结果为1234{},{},{},{}xxxx(2’)0.81110111011100001R,聚类结果为1234{,,},{}xxxx(2’)