因子分析数学模型1、因子分析看基本思想因子分析是一种旨在寻找隐藏在多变量数据中,无法直接观察到却影响或支配可观测变量的潜在因子,并估计潜在因子对可观测变量的影响程度,以及潜在因子之间的相关性的一种多元统计分析方法。其基本思想是从分析多变量数据的相关关系入手,找到支配这种相关关系的少数几个相关独立的潜在因子,并通过建立起这些潜在因子与原变量之间的数量关系来预测潜在因子的状态,帮助发现隐藏在原变量之间的某种客观规律性。因子分析和主成分分析都能起到清理多个原始变量内在结构关系的作用,但主成分分子重在综合原始变量信息,而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法。因子分析法就是这些潜在因子的数学模型方法,它是在主成分的基础上构筑若干个意义较为明确的潜在因子,以它们为框架分析原变量,以考察原变量间的联系与区别。2、因子分析的基本原理3、因子分析的数学模型假设对n例样品观测了p个指标,即𝑋1,𝑋2,…,𝑋𝑝,得到观测数据。我们的任务就是从一组观测数据出发,通过分析各指标𝑋1,𝑋2,…,𝑋𝑝之间的相关性,找出支配作用的潜在因子,使得这些因子可以解释各个指标之间的相关性。因子分析模型描述如下:(1)X=(𝑋1,𝑋2,…,𝑋𝑝)是可观测随机变量,均值向量E(X)=0,协方差Cov(X)与相关矩阵R相等,(只要将变量标准化即可实现)。(2)F=(𝐹1,𝐹2,…,𝐹𝑚)(m=p)是不可测的向量,其均值E(F)=0,协方差矩阵Cov(F)=1,即向量的各分量是独立的。(3)e=(𝑒1,𝑒2,…,𝑒𝑝)与F相互独立,且E(e)=0,e的协方差矩阵是对角矩阵,即各分量e之间是相互独立的。则因子分析的数学模型如下:{𝑋1=𝑎11𝐹1+𝑎12𝐹2+⋯+𝑎1𝑚𝐹𝑚+𝑒1𝑋2=𝑎21𝐹1+𝑎22𝐹2+⋯+𝑎2𝑚𝐹𝑚+𝑒2⋮𝑋𝑝=𝑎𝑝1𝐹1+𝑎𝑝2𝐹2+⋯+𝑎pm𝐹𝑚+𝑒𝑝由于该模型是针对变量进行的,各因子是正交的,所以也称为R型正交因子模型。其矩阵形式为:X=AF+e。其中:X={𝑋1𝑋2⋮𝑋𝑝A=[𝑎11𝑎12𝑎21𝑎22……𝑎1𝑚𝑎2𝑚⋮⋱⋮𝑎𝑝1𝑎𝑝2⋯𝑎𝑝𝑚]F={𝐹1𝐹2⋮𝐹𝑚,e={𝑒1𝑒2⋮𝑒𝑝对于因子分析,要求数据和模型满足以下假设条件:●𝑋𝑖是均值为0、方差为1的随机变量;●𝑒𝑖是均值为0,方差为常数的正太随机变量。●𝑒1,𝑒2,…,𝑒𝑝不相关,且方差不同。●Cov(F,e)=0,即F和e是相互独立的;●D(F)=I,即𝐹1,𝐹2,…,𝐹𝑚不相关、均值为0方差为1.我们把F称为X的公共因子或潜在因子,矩阵A称为因子载荷矩阵,e称为X的特殊因子,它们是在各个变量中都出现的因子,我们可以把它们看做高维空间中所张起的相互垂直的m个坐标轴。𝑒𝑖(i=1,2,…,p)表示影响𝑋𝑖的独特因子。𝑎ij做因子载荷,它是第i个变量在第j个主因子上的负荷,或者叫做第i个变量在第j个主因子上的权,它反映了第i个变量在第j个主因子上的相对重要性。(4)因子模型的性质X的协方差矩阵如下:∑𝑥=E(AF+e)(AF+e)'=AA'+∑𝑒为了得到因子分析结果的合理解释,因子载荷矩阵A中有两个统计量十分重要,即变量公共度和潜在因子的方差贡献。我们现在看看矩阵A的统计意义。由因子分析数学模型的假设条件知:{𝑋𝑖=∑𝑎ik𝐹𝑘+𝑒𝑖𝑚𝑘=1𝐼=VAR(𝑋𝑖)=∑𝑎ik2+𝜎𝑖2𝑚𝑘=1i=1,2,…,m因子载荷矩阵A中第i行元素之间平方和记为ℎ𝑖2,称为变量𝑋𝑖的公共度。即ℎ𝑖2=∑𝑎ik2𝑚𝑘=1,则有ℎ𝑖2+𝜎𝑖2=I,i=1,2,…,mℎ𝑖2是全部潜在因子对原始指标𝑋𝑖的方差所作出的贡献反映了全部潜在因子对变量𝑋𝑖的影响。