- 1.30 MB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
演讲者:XXX第十五章因子分析管理统计学Managementstatistics\n1.因子分析的基本概念2.因子分析的基本步骤3.SPSS因子分析的操作步骤目录管理统计学Managementstatistics\n因子分析的基本概念1因子变量的特点:1.因子变量的数量远少于原有变量,减少了分析计算的工作量;2.因子变量是对原始变量的重新组构,能够反映原始变量的绝大部分信息;3.因子变量间没有线性相关关系,避免了原始变量的共线性问题。4.因子变量具有命名解释性。2因子变量:代表各类信息的综合指标,也称公因子。3因子分析的优点:能以较少的因子变量和最小的信息损失来解释变量之间的结构。4因子分析:利用各变量间存在一定的相关关系,用较少的综合指标分别综合存在于各变量中的相关关系,而综合指标之间彼此不相关。北京理工大学管理与经济学院\n因子分析的基本概念12将关系错综复杂的原始变量综合为少数几个因子(不可观测,相互独立的随机变量),以再现因子与原始变量之间的内在联系。因子分析的主要应用:寻求基本结构,简化观测系统用于分类对p个变量或n个样品进行分类。北京理工大学管理与经济学院\n因子分析的基本概念12因子分析的分类:根据研究对象,可分为R型因子分析和Q型因子分析。两者的处理方法相同,只是出发点不同。R型因子分析:研究变量之间的相关关系。通过研究变量相关阵或协差阵的内部结构,找出控制所有变量的几个公共因子,用以对变量或样品进行分类。Q型因子分析:研究样品之间的相关关系,通过研究样品相似矩阵的内部结构,找出控制所有样品的几个主因子。北京理工大学管理与经济学院\n例题:为了解青年对婚姻家庭的态度,随机访问100人,询问30个问题,把这些问题归结于不可测的因子变量,即对外型的重视、对孩子的教育观点、对家庭的重视、对金钱的重视等其它方面。因子分析的目的:建立一个模型,用不可测的、所有原始变量共有的因子变量和每个原始变量所特有的特殊因子来描述可测的原始变量,进而分析和解释青年人对婚姻家庭的态度。管理统计学Managementstatistics\n因子分析的基本模型设是可观测的向量,是不可观测的公共因子向量,又与F相互独立,(即F的各分量方差为1,且互不相关)北京理工大学管理与经济学院管理统计学Managementstatistics\n因子分析的基本模型因子分析模型可构造成:上式的矩阵形式为:其中矩阵北京理工大学管理与经济学院\n矩阵是待估系数矩阵,称为因子载荷矩阵,系数a11是变量X1在因子F1上的载荷。为公共因子,一般对X每个分量Xi都有作用;为Xi的特殊因子,起残差的作用,只对Xi起作用。因子分析模型:因子分析的基本模型123北京理工大学管理与经济学院\n四个关键性的假设:因子分析的基本模型特殊因子互不相干,且;特殊因子与公共因子不相干,即;1234即向量F的协方差阵为m阶单位阵;即向量ε的协方差阵为p阶对角阵;北京理工大学管理与经济学院\n因子分析的基本步骤北京理工大学管理与经济学院因子分析的标准分析步骤:根据具体问题,判断原始变量是否适合作因子分析,并采用某些检验方法来判断数据是否符合分析要求。选择提取公因子的方法,并按一定标准确定提取的公因子数目。考察公因子的可解释性,并在必要时进行因子旋转,以寻求最佳的解释方式。计算出因子得分等中间指标进一步分析使用。1234\n因子分析的基本步骤北京理工大学管理与经济学院判断原始变量是否适合进行因子分析:1因子分析有一个默认的前提条件,就是原始各变量间必须有较强的相关性,否则根本无法从中综合出能反映原始变量结构的因子变量。所以一般在进行因子分析前,需先对原始变量进行相关分析。计算变量之间的相关系数矩阵并进行统计检验。如果相关系数矩阵中的大部分相关系数都小于0.3且未通过统计检验,那么就不适合作因子分析。最简单的方法:除此之外,SPSS还提供了几种帮助判断变量是否适合作因子分析的方法:(1)巴特利特球度检验;(2)反映象相关矩阵检验;(3)KMO检验。\n原假设H0:相关阵是单位阵,即各变量各自独立。检验的统计量:根据相关系数矩阵的行列式计算得到。判断方法:如果该统计量值较大且对应的相伴概率值小于显著性水平,则拒绝H0,认为相关系数矩阵不太可能是单位阵,适合作因子分析;如果该统计量值较小且对应的相伴概率值大于显著性水平,则不能拒绝H0,认为相关系数矩阵可能是单位阵,不适合作因子分析。(1)巴特利特球度检验(Bartletttestofsphericity)因子分析的基本步骤北京理工大学管理与经济学院判断原始变量是否适合进行因子分析1\n基本思想:将偏相关系数矩阵的每个元素取反,得到反映象相关阵。如果变量之间确实存在较强的相互重叠传递影响,由于计算偏相关系数时是在控制其它变量对两变量影响的条件下计算出来的净相关系数。判断方法:如果变量中确实能够提取出公共因子,那么偏相关系数必然很小,则反映象相关矩阵中的有些元素的绝对值比较大,则说明这些变量可能不适合作因子分析。(2)反映象相关矩阵(Anti-imagecorrelationmatrix)检验因子分析的基本步骤北京理工大学管理与经济学院判断原始变量是否适合进行因子分析1\n基本思想:KMO统计量是比较各变量间简单相关系数和偏相关系数的大小。判断方法:KMO统计量的取值在0和1之间,KMO统计量越接近1,则越适合作因子分析,KMO统计量越小,则越不适合作因子分析。一般认为,KMO值大于0.9就非常适合,0.7以上效果一般;0.6则不太适合,0.5以下不适合。(3)KMO(Kaiser-Meyer-Olkin)检验因子分析的基本步骤判断原始变量是否适合进行因子分析北京理工大学管理与经济学院1\n2因子分析的基本步骤北京理工大学管理与经济学院提取公因子和确定公因子数目常用提取公因子的方法:主成分分析法,最大似然法,α因子提取法等。在此仅简单解释应用最广泛的主成分分析法。\n主成份分析法的目的:从原始的多个变量取若干线性组合,使得能尽可能多地保留原始变量中的信息。2因子分析的基本步骤北京理工大学管理与经济学院提取公因子的方法(主成分分析法)主成份分析法的手段:通过坐标变换手段,将原始变量转换到新变量是一个正交变换(坐标变换)。设有是一个p维随机变量,记考虑它的线性变换:该方程组要求:\n2因子分析的基本步骤北京理工大学管理与经济学院其中,依照以下两个原则来确定:(1)与互不相关;(2)是的一切线性组合中方差最大的;是与不相关的的一切线性组合中方差最大的;同理,是与不相关的的一切线性组合中方差最大的。在实际应用中,一般选取前面几个方差最大的主成分。称为原始数据的第一、第二、…、第p主成分。对原始变量的保留信息最多,因为其在总方差中所占的比重最大,其余的主成分保留的原始信息相应地递减。提取公因子的方法(主成分分析法)\n因子分析的基本步骤北京理工大学管理与经济学院主成分数学模型的系数求解步骤归纳如下:2(1)将原有变量数据进行标准化处理;(2)计算变量的简单相关系数矩阵;(3)求解协方差阵的特征根,并将特征值从大到小排序并重新编码:(4)按预先规定所取的P个公因子的累计方差贡献率达到的百分比m%;定义为主成分的贡献率,为主成分的累计贡献率。提取公因子的方法(主成分分析法)\n因子分析的基本步骤北京理工大学管理与经济学院主成分数学模型的系数求解步骤:2(5)确定所选定的前k个特征值,并求出相应的单位特征向量。(6)写出因子负荷阵。提取公因子的方法(主成分分析法)\n因子分析的基本步骤北京理工大学管理与经济学院2确定公因子数目的方法(1)根据特征根来确定特征根在某种程度上可看成是表示公因子影响力度大小的指标,如果特征根小于1,说明该公因子的解释力度还不如直接引入一个原变量的平均解释力度大。因此在SPSS中默认用特征根大于1作为纳入标准。(2)根据公因子的累积方差贡献率来确定公因子的累积方差贡献率就是主成分分析中的主成分的累积贡献率。一般来说,提取公因子的方差累积贡献率达到85%-90%以上就比较满意了,可以此决定需要提取多少个公因子。大量实践表明,根据方差累积贡献率确定公因子数往往较多,而用特征根来确定又往往偏低,许多时候应当将两者结合起来。\n重点在于提取出的公因子的可解释性上。如果有实际意义,即使贡献率较小,也可以考虑保留。而如果特征根大于1,但是找不到合理的解释,则也可考虑将该公因子去除。因子分析的基本步骤北京理工大学管理与经济学院2确定公因子数目的方法提取公因子数量的原则:\n因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3某个原始变量xi同时与几个公因子都有比较大的相关关系,即xi的信息要由若干个公因子共同解释;同时,虽然一个公因子能够解释许多原始变量的信息,但它都只是解释每一个原始变量的一部分信息,而不是任何一个变量的典型代表。这样在按照默认的分解方式,各因子可能难以找到所代表的实际意义。实际分析中的常见问题:\n因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3因此,可以利用这一特点对因子载荷矩阵进行适当的旋转,使公因子载荷系数向更大(向1)或更小(向0)方向变化,使得对公因子的命名和解释变得更加容易,但保持因子载荷矩阵A各行的元素的平方和即变量X的共同度不变。因子模型的一个特点:因子载荷阵不唯一。实现以上目的是通过因子轴的旋转进行变换的。\n因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3设从公因子F旋转到公因子G,则模型变为:其中,b11仍称为因子载荷。比较旋转前后的模型,可看出旋转并不影响公因子的提取过程和结果,只会改变原始变量的信息量在不同因子上的分布,即改变因子载荷阵。\n因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3常用的旋转方法分类:正交旋转和斜交旋转。正交旋转:在因子旋转过程中如果因子轴仍相互正交。斜交旋转:在因子旋转过程中如果因子轴之间不是相互正交的。进行正交变换可以保证变换后各因子仍正交,这是比较理想的情况。最常用的斜交旋转:方差最大化正交旋转(Varimax)旋转原则:各因子仍保持直角正交,但使得因子间方差的差异达到最大,即使得在每个因子具有较高载荷的变量个数最小化。这种方法一般能简化对因子的解释。\n因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3如果正交变换后对公因子仍然不易解释,也可以进行斜交旋转,或许可以得到比较容易解释的结果。最常用的斜交旋转:倾斜旋转(Promax)旋转原则:在方差最大化正交旋转的基础上进行斜交旋转,计算速度较快,旋转后允许因子间存在相关(交角非直角)。\n因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3因子命名有一些原则:(1)因子分析的命名必须简明、用尽量少的词(2~3个)去解释因子。(2)必须要注重不同因子荷载高的变量之间的相似性(3)可以根据因子中包含什么样的变量来给因子命名。对因子矩阵进行旋转后,就必须给不同的因子进行命名。\n因子分析的基本步骤北京理工大学管理与经济学院计算因子得分4在因子分析中,还可以将公因子表示为原始变量的线性组合,这样就可以从原始变量的观测值估计各个公因子的值,此值就是因子得分。称为因子得分模型,每一个式子都是因子得分函数。由此可以得到以下模型:\n因子分析的SPSS实现1.选择Analyze→DataReduction→Factor3.可选一变量作为样本的筛选变量移入到SelectionVariable框中。选Value钮填入一数值,则变量等于此数值的样本才能参与因子分析。2.将参与因子分析的变量移入到Variables框中。管理统计学Managementstatistics\n因子分析的SPSS实现4.单击Descriptives按钮,出现如下图的子对话框。其中:Statistics复选框组中提供了分析中一些常用的描述统计量。管理统计学Managementstatistics\n因子分析的SPSS实现5.单击Extraction按钮,出现如下图的子对话框。其中:Method下拉框中给出的是提取公因子的方法,共七种,SPSS默认的是主成分分析法(Principalcomponents);管理统计学Managementstatistics\n因子分析的SPSS实现6.单击Rotation按钮;管理统计学Managementstatistics\n因子分析的SPSS实现7.单击Scores按钮;8.单击OK按钮,显示输出结果。管理统计学Managementstatistics\nTheEnd管理统计学Managementstatistics