描述性统计标准偏差多少可信
发布网友
发布时间:2023-05-27 08:18
我来回答
共3个回答
热心网友
时间:2024-03-04 04:25
描述性统计,是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各项活动。
描述性统计就是用来描述数据特征的一种方法,将大量的看起来毫无规律的数据运用计算、概况等方法进行分析,通过表、图形等更直观的展现出来。
描述性统计常用的指标
常用的指标有平均值、中位数、四分位数、标准差、标准分和变异系数。
1.平均值(μ)
平均值是应用最广泛地指标之一,但是平均值容易受到异常值的影响。譬如经常让我们陷入自我怀疑的某某行业人均工资!
举个栗子:比如某餐厅现在有A、B、C三位客人,假设月薪分别是10K、11K、12K。他们3人的月薪的均值为11K。这时候马云进入了餐厅,假设他的月薪是100K。此时4人的月薪均值为33.25K。
我们可以看到,马云这个异常值的加入使得月薪的平均值发生了很大的变化。所以我们在处理数据的时候,就要识别异常值,并对异常值进行相应的处理,才能使平均值反映出数据的真实情况。由此,我们也可以看出,平均值在认识数据上具有一定的局限性,我们在实际应用中要多参考几个指标。
2.中位数
中位数是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
相较于平均数,中位数受异常值的影响很小。
3.四分位数
3.1 四分位数的定义
四分位数也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。多应用于统计学中的箱线图绘制。
确定四分位数首先要先对数据进行排序,然后确定四分位数的位置。
第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
四分位数的确定方法有好几种,每种方法得出的四分位数会略有差距,但差距一般不会太大。
3.2 箱线图
箱线图是一种用作显示一组数据分散情况资料的统计图。绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。
热心网友
时间:2024-03-04 04:25
越小越可信。描述性统计标准偏差(RSD,relative standard deviation)就是指标准偏差与测量结果算术平均值的比值,即相对标准偏差(RSD)=标准偏差(SD)/计算结果的算术平均值(X)*100% 该值通常用来表示分析测试结果的精密度
热心网友
时间:2024-03-04 04:26
标准误差小,大量的测量可靠性,相反,本来就不大的可靠的测量描述性统计分析一般有二种方法可以进行:1、频数分布分析,2、列联表分析。
百度知道