最短距离法:定义iG与jG之间的距离为两类最近样品的距离,即为ijGXGXijdDjjii,,minmin,设类pG与qG合并成一个新类记为rG,则任一类kG与rG的距离为kqkpijGXGXijGXGXijGXGXkrDDdddDqjkipjkirrkk,minmin,minminmin,,,最短距离法进行聚类分析的步骤如下:(1)定义样品之间距离,计算样品的两两距离,得一矩阵记为)0(D,开始每个样品自成一类,显然这时ijijdD。(2)找出距离最小元素,设为pqD,则将pG与qG合并成一个新类记为rG,即qprGGG,。(3)按公式计算新类与其他类的距离。(4)重复(2)(3)两步,直到所有元素合并成一类为止。如果某一步距离最小的元素不止一个,则对应这些最小元素的类可以同时合并。R型因子分析模型:R型因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素,每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即,2211imimiiiFaFaFaXpi,,2,1(1)(1)式中的mFFF,,21称为公共因子,i称为iX的特殊因子。该模型可用矩阵表示为AFX(2)这里mpmppmmAAAaaaaaaaaaA,,21212222111211,pXXXX21,mFFFF21,p21且满足:(1);pm(2)0),cov(F,即公共因子与特殊因子是不相关的;(3)mFIFDD10101)(,即各个公共因子不相关且方差为1;(4)2222100)(pDD,即各个特殊因子不相关,方差不要求相等。模型中的ija称为因子“载荷”,是第i个变量在第j个因子上的负荷,如果把变量iX看成m维空间中的一个点,则ija表示它在坐标轴jF上的投影,因此矩阵A称为因子载荷矩阵。因子旋转:令,)(***mpijaAAiijijhad/*,piijjdpd121则的第j列元素平方的相对方差可定义为pijijjddpV122)(1(1)所谓最大方差旋转法就是选择正交矩阵,使得矩阵*A所有m个列元素平方的相对方差之和mVVVV21(2)达到最大。V是旋转角度的函数,按照最大方差旋转法的原则,求使得V达到最大。pBACpABD/)(/24tan22(3)其中piiuA1,piivB1,piiivuC122)(,piiivuD122221)()(iiiiihahau,2212iiiihaav其正交变换矩阵为kllk11cossin11sincos1其中是因子轴klFF和的旋转角度,矩阵中其余位置上的元素全为0,m个公共因子两两配对旋转共需进行)1(212mmCm次,称其为完成了第一次旋转,并记第一轮旋转后的因子载荷矩阵为)1(A,然后再重新开始,进行第二轮的2mC次配对旋转,新的因子载荷矩阵记为)2(A。这样可以得到一系列的因子载荷矩阵为,,,,)()2()1(sAAA记)()(SSAV为各列元素平方的相对方差之和,则必然有)()2()1(sVVV,这是一个有界的单调上升数列,因此,一定会收敛到某个极限,当)(sV的值变化不大时,即可停止旋转。计算因子得分:设公共因子可在对p个原始变量作回归,即,ˆ110PjpjjjXbXbbFmj,,1如果jF,iX都标准化了,回归的常数项为零,即0jib。由因子载荷的统计意义可知,对于任意的mjpi,,1,,,1,都有ipjpjpjpjijiFXprbrbXbXbXEFXEraji1111,)]([)(记mpmmppbbbbbbbbbB212222111211则上式可写成矩阵形式'RBA于是XRABXFFFm11'ˆˆˆ,即得因子得分的估算公式XRAF1'ˆ其中R是X的相关系数矩阵。