基于参数化T范数分类问题的推理及其敏感性分析卢明珠报告提纲研究的目的与意义近期工作与主要困难研究的目的与意义本课题将参数化的T-norm和T-conorm分别引入分类规则的前件与规则间的合成,主要是试图建立基于参数化T-norm分类推理的一般模型,在模型中考察参数化T范数的参数p的变化对分类精度的影响。研究分类准确率对于参数p的敏感性,旨在发现其中的变化规律并给出敏感性的合理性解释与参数选择的建议。课题研究的意义在于增强模糊系统对分类问题推理的正确性,提高系统的泛化能力,对用于各种分类问题的模糊系统的设计提供有用的指导。并尽可能给出理论支撑。推理过程不同的参数化T范数的敏感性比较尝试在推理过程中使用不同参数化T范数,考察其中各自参数变化时对推理精度的影响,在实验中主要使用的参数化T范数为Hamacher和schweizer(3)函数。首先比较一下两个参数化T范数的形式:withp0(,)0.(1)()xyTxywithpppxyxy(1)(2)(,)1(1,1)0.1(1)(1)(1)xyxypxyxypxySxyTxywithppxyppxy1/ppppp]y)-(1x)-(1-y)-(1x)-[(1-1y)T(x,1/ppppp)yx-y(x)y1,x1(T1)y,x(Sy=0.7时T-norm与y=0.3时T-conorm的变化性质的比较从图中我们可以看到HamacherT-norm是递减函数,其S-norm为递增函数。schweizer(3)T-norm是递增的函数,其S-norm为递减函数;这是我们目前得之的除函数形式不同之外,性质上的明显差别,那么他们在模型中S(T(X1,X2,…Xn))作用后的单调性如何?简单的以S(t(x,y),z)为例,说明问题。在y=0.3,z=0.5时,横轴是x,纵轴时输出的函数值,不同的系列表明p取值的不同。除了p=0稍有不同,其他的随着p的增加,函数输出的值也在增加。00.10.20.30.40.50.60.700.20.40.60.811.2系列1系列2系列3系列4系列5系列6系列7系列8系列9系列10类似的,以下分别是:y=0.7,z=0.3时和y=0.5,z=0.5时的情况,横轴是x,纵轴时输出的函数值,除了p=0稍有不同,其他的随着p的增加,函数输出的值也在增加。由此我们初步得出模型中S(T(X1,X2,…Xn))在使用Hamacher函数是为递增的函数,同种方法得到了schweizer(3)T-norm为递减函数,目前不太确定此种方法的有效性。00.10.20.30.40.50.60.70.800.20.40.60.811.2系列1系列2系列3系列4系列5系列6系列7系列8系列9系列1000.10.20.30.40.50.60.70.800.20.40.60.811.2系列1系列2系列3系列4系列5系列6系列7系列8系列9系列10敏感性比较上次已经介绍了使用Hamacher参数化T范数与S范数的推理模型随参数p的变化,分类准确率的变化情况;下面看schweizer(3)参数化范数仅仅由于参数化范数性质的不同,表现出来的分类准确率随参数p的变化情况是否是正好相反的?如图:主要困难使用Hamacher函数时的遗留问题,未能给出候选属性既有离散值又有连续值的数据库的敏感性解释。实验的方法来考察敏感性,虽然在大量的随机实验中能够总结出一些规律,给出一定的合理的解释,但是最终还是需要理论来支撑。这个理论的探索目前还没有进展,急待解决。通过两个不同T范数族的比较,我们发现他们表现的规律并不相同,对此现象也需要进一步的探索和解释,需要数学功底。谢谢!推理模型中使用schweizer(3)参数化T范数的UCI数据库的实验结果左侧的图为Iris在三个中心点时的一次参数p与分类准确率的变化关系图,右侧为6个中心点时的情况。由于变化趋势比较复杂,所以没有拟和。左侧为pima的一次实验结果,随p的增加,分类准确率呈现了比较复杂的变化,由此为p在[0,100]的变化趋势。上面是候选属性为连续值的数据库体现出的无规律性。下面是既有连续又有离散值的数据库,以cmc为例,有时敏感,有时有敏感。离散值后选属性的数据库,目前实验表明不敏感。返回