如何处理统计数据中的极端数值简答题?
发布网友
发布时间:2022-04-25 14:31
我来回答
共1个回答
热心网友
时间:2023-10-09 06:12
你说的可能是数据分析中的一种方法吧
截尾平均数,也叫截尾均值
截尾均值是指在一个数列中,去掉两端的极端值后所计算的算术平均数,也称为切尾均值。最常见的截尾均值的例子是在一些比赛中,计算选手的最终得分需要“去掉一个最高分,去掉一个最低分”,这种处理方法,即为计算截尾均值的方法。
截尾均值由于去掉了数列中影响数据稳定性的极端值,从而具有较好的稳健性,不易受到极端值的干扰。在数据序列本身存在少量错误的情况下,通过有效地判定极端值,并将极端值去掉来计算算术平均数,可以获得较为真实地反映数据情况的平均指标。
极端值的判定根据分析目的的不同,可以有下列各种不同的方法:
1.确定两端或者一端固定数量的值为极端值
例如确定最大值和最小值为极端值,而不去观察这两个值本身是多少。
2.确定一个固定范围外的数值为极端值
在数据处理时,人为地确定一个取值范围,超出这范围内的数值一律被当作极端值