问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

spss描述性分析

发布网友 发布时间:2022-04-20 23:13

我来回答

2个回答

热心网友 时间:2023-04-29 02:19

你好
一、描述性统计分析

概念:是以概括性数据描述数据特征的各项活动。

通俗的讲就是用儿子代表全家

集中趋势:关于数据“中心位置”的某种表述,也就是常说的“平均起来”

常见的有均数、中位数等

离散趋势:反应数据的波动范围大小

常见的有标准差、方差、四分位数

分布特征:数据的分布应该满足某种特征,比如正态分布

衍生出一系列概念描述数据与正态分布之间的关系,比如偏度系数以及封度系数

二、集中趋势描述指标

算数平均数:使用一个数高度浓缩数据,也就是说平均数是描述一组数到一个数的距离。

使用范围:定距变量,单峰(如上图)或者基本对称的情况下才适用使用平均数。也就是说

均数适用于正态分布(包含极值的称为偏态分布)。在正态分布中均值代表集中趋势。

中位数:是一种位置平均数,将整体各单位按照大小排序,取中间位置的数

捷尾均数:去掉极值之后的均数

三、离散趋势描述指标

极差:最大值与最小值之差。反应数据的离散幅度,或者变异范围。

局限:取决于极端情况:1、不能反应数据分布情况

2、受极端值影响较大,不符合数据稳健性要求

适用于大体上了解数据的波动情况。

方差和标准差:

本质上反应数据与均值的差异情况。这种差异称为离散也称变异。

方差与标准差只适用于正态分布(无极端值)

分位数:

分位数本质上反应的是缩小极端值对变异幅度的影响。

适用范围:样本足够多。只是人为的切割,并非通过计算得出,不如均值和标准差精准。但是

中间位置原理极值,样本稳定。

变异系数:

是标准差与平均数的比值。

本质上是消除数据大小差异(平均数)后的波动情况(标准差)

四、连续变量的参数估计

正态分布:

是关于均值对称的分布,均值处为最大值。同时标准差(个体差异)影响曲线的形态(矮阔尖峭)

偏度:描述分布不对称的方向和程度。

尾巴所在的方向为分布方向

峰度:描述曲线的陡峭程度

标准正态分布:标准差为1,关于0对称

如果偏度系数标准差/峰度系数标准差>2说明不服从正态分布。

五、spss的实现

tvg指偏度系数标准差,利润范围指峰度系数标准差。

热心网友 时间:2023-04-29 02:19

一、数据处理

1、数据变量

数据类型主要为字符型、数值型和日期型三种。

2、变量尺度

即变量的度量标准。主要为名义(N)——分类变量、度量(S)——连续变量。

3、数据清洗

删除重复项:

利用【数据】→【标识重复个案】→将所有变量放入【定义匹配个案的依据】→【确定】

结果中0代表重复个案,1为唯一个案,升序排列,删除最后一个基本个案值为0的项,重复项就删除了。


4、数据抽取

4.1、字段拆分

打开数据文件→【转换】→【计算变量】→【函数组】→【字符串】→【CHAR.SUBSTR(3)函数】→新建【目标变量】→填写【字符串表达式】→【确定】该函数有三个参数CHAR.SUBSTR(字符串表达式,位置,长度)例如:

CHAR.SUBSTR(‘abcd’,2,2)返回“bc”



4.2、随机抽样

打开文件→【数据】→【选择个案】→【随机个案样本】→【样本】→输入选择随机样本数,可以输入20%的所有个案。

5、数据合并

5.1、字段合并

打开文件→【转换】→【计算变量】→【函数组】→【字符串】→【CONCAT函数】→填写【字符串表达式】→新建【目标变量】→【确定】

Concat(strexpr,strexpr2,,,,,)例如concat(年,“-”,月,“-“,日)strexpr是字符串变量。

5.2、记录合并

打开文件→【数据】→【合并文件】→【添加个案】→【外部SPSS Statistics数据文件】→选择文件→继续→确定

6、数据分组

6.1、可视分箱

打开文件→【转换】→【可视离散化】→【要离散的变量】→选择要离散化的变量→【继续】→命名【离散的变量】→点击【生成分割点】→填写【第一个分割点位置】、【分割点数】、【宽度】→【应用】→【生成标签】→【确定】

6.2、重新编码

打开文件→【转换】→【重新编码为不同变量】→选择【输入变量】→命名【输出变量】→【更改】→【旧值和新值】→【旧值】→【范围】→【新值】→【添加】→【确定】

7、数据标准化

7.1、0-1标准化

对原始数据进行线性变换,使结果落到【0,1】区间。

公式为

X^=x-min/max-min

打开文件→【转换】→【计算变量】→【数字表达式】框中输入公式→命名【目标变量】为标准化值→【类型与标签】→【数值】→【继续】→【确定】

7.2、Z标准化

将变量中的测量值处理成服从标准正态分布的数据值,即均值μ为0,标准差σ为1。

X^=(x-μ)/σ

打开文件→【分析】→【描述统计】→【描述】→选择变量→勾选【将标准化值另存为变量】→【确定】

二、描述性分析

1、频率分析

1.1 分类变量频率分析

打开文件→【分析】→【描述统计】→【频率】→选择要进行频率分析的变量到【变量】→【确定】

1.2 打开文件→【分析】→【描述统计】→【频率】→选择要进行频率分析的变量到【变量】→点击【统计量】选择想要输出的统计量→【继续】→点击【图表】按钮→选择【直方图】勾选【在直方图中显示正态曲线】→勾选【显示频率表】→【确定】

2、描述分析

【分析】→【描述统计】→【描述】→选择变量→【选项】→选择需要输出的统计量→【继续】→【确定】

3、交叉表分析

【分析】→【描述统计】→【交叉表】→选择行变量、列变量→【单元格】选择输出格式,可以勾选【百分比】→【继续】→【确定】

4、数据报表制作

【分析】→【表】→【设定表】→选择变量到行或者列→【摘要统计量】选择想要添加的其他统计量(比如列数N%)→【分类和总计】添加小计/总计→【应用选择】→【确定】


还有不明白的也可以去SPSS中文官网看看。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
干货| 如何利用PPT绘制手绘图像(内含视频教学)。 小米Mix2s开发者选项的设置与应用指南(探索小米Mix2s开发者选项)_百度... 我今年41岁女,我想问一买哪种养老保险更合算,可以一次买吗?要多少... 我们家有营业执照。我现在41岁了。养老保险如何来买?一年,交多少钱? 搅拌桩的两喷两搅怎么理解 ...上关于一喷二搅、二喷二搅、二喷三搅、二喷四搅的具体做法 两搅两喷与四搅四喷的区别 三轴搅拌桩两搅四喷是什么意思 梦幻西游将军令怎么解绑 EXCEL表,求值? 如何取消电脑浏览器中不再收到GoogleChrome更新的提示 正在升级!不想升级了怎么取消!!快快快 2、简述空间分析的主要步骤? Win10升级通知没出现怎么办 数据可视化,信息可视化,知识可视化三者的区别和联系 win10没有收到更新通知,怎么最快获取最新版更新 请教关于SPSS统计分析问题(数据离散) 数据可视化属于哪个方向 系统更新要不要点 三维可视化是什么? 怎么样可以让电脑更新变快 怎样撰写统计分析报告 iphone 经常自动提示更新系统可以取消吗? 有哪些数据可视化的好工具 oppo已经是更新软件该怎么取掉 统计数据整理的内容一般有 win10能取消自动更新吗 统计分析法 如何统计和分析利用网络大数据? 通过箱线图判断偏向 如何转行做数据分析? 数据可视化的优秀入门书籍有哪些? 能不能快一点更新啊 统计学假设检验的原假设怎么设? cad2006安装成教育版的,想改成正常版本的,怎么改? 装了CAD2006学生版后,卸载了后装了几次正式版的,还是显示是学生版!怎么解决啊? 装cad2006不小心注册成了教育版怎么办? AutoCAD 2006 打开的图纸会是教育版,怎么转换为普通格式 cad2006装上后是教育版 不想要教育版的! cad2006打印时出现教育版生成的问题,求彻底卸载方法 CAD2006教育版,有破解版嘛?如何去掉教育版戳记? 404 Not Found win7装cad2006为什么会是教育版 为什么在网上下载的AUTO CAD2006都是学生版,教育版的? CAD2006和天正打印后老是显示教育版怎么删除 CAD2006教育版激活码 装了CAD2006学生版后,卸载了后装了几次正式版的,还是显示是学生版!怎么解决啊? 为什么我在安装CAD2006的时候会是学生版本?而且打印出来有教育版本的字? 我的AUTOCAD2006为什么是学生版?打印时图纸出现由...