spss分析方法-对应分析(转载)
发布网友
发布时间:2022-09-17 12:52
我来回答
共1个回答
热心网友
时间:2023-10-16 17:26
对应分析也称关联分析、R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。对应分析法是在R型和Q型因子分析的基础上发展起来的一种多元统计分析方法。 下面我们主要从下面四个方面来解说:
[if !supportLineBreakNewLine]
[endif]
实际应用
理论思想
建立模型
[if !supportLineBreakNewLine]
[endif]
分析结果
[if !supportLineBreakNewLine]
[endif]
一、实际应用
对应分析法 可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系 。当所涉及的 分类变量类别较多或者分类变量的个数较多 的时候,我们就需要用到对应分析。主要应用在市场细分、产品定位、地质研究以及计算机工程等领域中。原因在于,它是一种视觉化的数据分析方法,它能够将几组看不出任何联系的数据,通过视觉上可以接受的定位图展现出来。
[if !supportLineBreakNewLine]
[endif]
二、理论思想
由于指标型的因子分析和样品型的因子分析反映的是一个整体的不同侧面,因此它们之间一定存在内在的联系。如果能够有效利用这种内在联系所提供的信息,对更全面合理地分析数据具有很大的帮助。在因子分析中,如果研究的对象是样品,可采用Q型因子分析;如果研究的对象是变量,则需采用R型因子分析。但是,因为这两种因子分析方法必须分别对样品和变量进行处理,所以这两种分析方法往往存在着相互对立的关系,为我们发现和寻找它们的内在联系制造了困难。而对应分析通过一个过渡矩阵Z将两者有机地结合了起来。 对应分析的基本思想是将一个联列表的行和列中各元素的比例结构,以点的形式在较低维的空间中表示出来。 首先,给出指标变量点的协差阵A=Z,Z和样品点的协差阵B=ZZ’,由于两者有相同的非零特征根,所以可以很方便地借助指标型因子分析而得到样品型因子分析的结论。如果对每组变量选择前两列因子载荷,那么两组变量就可以画出两个因子载荷的散点图。由于这两个图所表示的载荷可以配对,于是就可以把这两个因子载荷的两个散点图画到同一张图中,并以此来直观地显示各行变量和各列变量之间的关系。
[if !supportLineBreakNewLine]
[endif]
三、建立模型
[if !supportLineBreakNewLine]
[endif]
数据条件:
[if !supportLists]§ [endif]不能用于相关关系的假设检验
对应分析案例:
[if !supportLineBreakNewLine]
[endif]
题目:费希尔在1940年首次介绍列联表资料时使用的是一份关于眼睛颜色与头发颜色的调查研究数据。该研究数据包含了5387名苏格兰北部的凯斯纳斯郡的小学生的眼睛颜色与头发颜色,如下表所示。试用对应分析方法研究眼睛颜色与头发颜色之间的对应关系。
一、数据输入
二、操作步骤 1、进入SPSS,打开相关数据文件,因为本例中是以频数格式录入数据的(相同取值的观测只录入一次,另加一个频数变量用于记录该数值共出现了多少次),所以进入SPSS后,首先要对数据进行预处理,以频数变量进行加权,从而将数据指定为该种格式。选择“数据”|“个案加权”命令。首先在“个案加权”对话框的右侧选中“个案加权系数”单选按钮,然后在左侧的列表框中选择“频数”进入“频率变量”列表框。单击“确定”按钮,完成数据预处理。
2、选择“分析”|“降维”|“对应分析”命令。先定义行变量及其取值范围,即在“对应分析”对话框的左侧选择“眼睛颜色”进入右侧的“行”列表框,然后单击下方的“定义范围”按钮,在“最小值”中输入“1”,“最大值”输入“4”,单击“更新”按钮,最后单击“继续”按钮返回“对应分析”对话框。利用同样的方法定义列变量及其取值范围。列变量选择“头发颜色”,设置“最小值”为“1”,“最大值”为“5”。
3、其余设置采用系统默认值即可。单击“确定”按钮,等待输出结果。
[if !supportLineBreakNewLine]
[endif]
四、结果分析
1、对应分析表下表是按照原始数据整理而成的行列表,反映的是眼睛颜色和头发颜色不同组合下的实际样本数。
2、对应分析摘要在下表中,第一列是维度,其个数等于变量的最小分类数减1,本例中的最小分类数是眼睛颜色的种类(为4类),所以维度是3;第2~5列分别表示奇异值、惯量、卡方值和显著性;随后的列给出了各个维度所能解释的两个变量关系的百分比,容易发现,前两个维度就累计解释了99.6%的信息。
3
、对应分析坐标值及贡献值下表给出了行变量(眼睛颜色)和列变量(头发颜色)在各个维度上的坐标值,以及各个类别对各维数的贡献值。以本表上部分概述行点为例,对表中各列含义做一下简要说明。 “ 数量”列表示各种类别的构成比 ,如深色眼睛的人占总数的构成比例是0.244。 “维得分”列表示各类别在相关维数上的评分 ,首先给出的是默认提取的两个维数上各类别的因子负荷值。 “惯量”列给出了总惯量(0.23)在行变量中的分解情况,数值越大表示该类别对惯量的贡献越大。“点对维的惯量”表示在各个维数上,信息量在各类别间的分解状况 ,本例中第一维数主要被深色、蓝色、浅色所携带,也就是说这3个类别在第一维数上的区分比较好,第二维数主要被深色、棕色、蓝色所携带,说明这3个类别在第二维数上的区分比较好。 “维对点的惯量”表示各类别的信息在各维数上的分布比例 ,本例中深色、蓝色、浅色都主要分布在第一维数上,棕色主要分在第二维数上。 “总计”表示各维数的信息比例之和 ,可见红色这一类别在前两位中只提出了80.3%的信息,效果最差。
4、对应分析图下表是对应分析图,是对应分析中最主要的结果,从图中可以看出两个变量不同类别之间的关系。我们可以从两个方面来阅读本图:一方面可以分别从横坐标和纵坐标方向考察变量不同类别之间的稀疏,如果靠得近,则说明在该维数上这些类别之间差别不大;另一方面可以把平面划分为以(0,0)为原点的4个象限,位于相同象限的不同变量的分类点之间的关联较强。容易发现本例中:棕色头发和棕色眼睛,深色头发、黑色头发和深色眼睛,金色头发和蓝色眼睛、浅色眼睛存在着比较强的联系。
分析结论: 通过分析,我们可以知道:由结果分析1可知,眼睛颜色和头发颜色在不同组合下的实际样本数。由结果分析2可知,提取的前两个维数累计就已解释了99.6%的信息。由结果分析3可知,眼睛颜色和头发颜色在各个维数上的坐标值,以及各个类别对各个维数的贡献值。由结果分析4可知,棕色头发和棕色眼睛,深色头发、黑色头发和深色眼睛,金色头发和蓝色眼睛、浅色眼睛存在着比较强的联系。
(获取更多知识,前往 gz 号程式解说)
原文来自 https://mp.weixin.qq.com/s/Bt4IzRvcDRAtHKUtmuO57w