发布网友 发布时间:2022-04-20 23:13
共2个回答
热心网友 时间:2023-04-29 02:19
你好热心网友 时间:2023-04-29 02:19
一、数据处理
1、数据变量
数据类型主要为字符型、数值型和日期型三种。
2、变量尺度
即变量的度量标准。主要为名义(N)——分类变量、度量(S)——连续变量。
3、数据清洗
删除重复项:
利用【数据】→【标识重复个案】→将所有变量放入【定义匹配个案的依据】→【确定】
结果中0代表重复个案,1为唯一个案,升序排列,删除最后一个基本个案值为0的项,重复项就删除了。
4、数据抽取
4.1、字段拆分
打开数据文件→【转换】→【计算变量】→【函数组】→【字符串】→【CHAR.SUBSTR(3)函数】→新建【目标变量】→填写【字符串表达式】→【确定】该函数有三个参数CHAR.SUBSTR(字符串表达式,位置,长度)例如:
CHAR.SUBSTR(‘abcd’,2,2)返回“bc”
4.2、随机抽样
打开文件→【数据】→【选择个案】→【随机个案样本】→【样本】→输入选择随机样本数,可以输入20%的所有个案。
5、数据合并
5.1、字段合并
打开文件→【转换】→【计算变量】→【函数组】→【字符串】→【CONCAT函数】→填写【字符串表达式】→新建【目标变量】→【确定】
Concat(strexpr,strexpr2,,,,,)例如concat(年,“-”,月,“-“,日)strexpr是字符串变量。
5.2、记录合并
打开文件→【数据】→【合并文件】→【添加个案】→【外部SPSS Statistics数据文件】→选择文件→继续→确定
6、数据分组
6.1、可视分箱
打开文件→【转换】→【可视离散化】→【要离散的变量】→选择要离散化的变量→【继续】→命名【离散的变量】→点击【生成分割点】→填写【第一个分割点位置】、【分割点数】、【宽度】→【应用】→【生成标签】→【确定】
6.2、重新编码
打开文件→【转换】→【重新编码为不同变量】→选择【输入变量】→命名【输出变量】→【更改】→【旧值和新值】→【旧值】→【范围】→【新值】→【添加】→【确定】
7、数据标准化
7.1、0-1标准化
对原始数据进行线性变换,使结果落到【0,1】区间。
公式为
X^=x-min/max-min
打开文件→【转换】→【计算变量】→【数字表达式】框中输入公式→命名【目标变量】为标准化值→【类型与标签】→【数值】→【继续】→【确定】
7.2、Z标准化
将变量中的测量值处理成服从标准正态分布的数据值,即均值μ为0,标准差σ为1。
X^=(x-μ)/σ
打开文件→【分析】→【描述统计】→【描述】→选择变量→勾选【将标准化值另存为变量】→【确定】
二、描述性分析
1、频率分析
1.1 分类变量频率分析
打开文件→【分析】→【描述统计】→【频率】→选择要进行频率分析的变量到【变量】→【确定】
1.2 打开文件→【分析】→【描述统计】→【频率】→选择要进行频率分析的变量到【变量】→点击【统计量】选择想要输出的统计量→【继续】→点击【图表】按钮→选择【直方图】勾选【在直方图中显示正态曲线】→勾选【显示频率表】→【确定】
2、描述分析
【分析】→【描述统计】→【描述】→选择变量→【选项】→选择需要输出的统计量→【继续】→【确定】
3、交叉表分析
【分析】→【描述统计】→【交叉表】→选择行变量、列变量→【单元格】选择输出格式,可以勾选【百分比】→【继续】→【确定】
4、数据报表制作
【分析】→【表】→【设定表】→选择变量到行或者列→【摘要统计量】选择想要添加的其他统计量(比如列数N%)→【分类和总计】添加小计/总计→【应用选择】→【确定】
还有不明白的也可以去SPSS中文官网看看。