异常值剔除方法有哪些?
发布网友
发布时间:2024-10-15 09:01
我来回答
共1个回答
热心网友
时间:2024-10-30 01:09
剔除数据中的异常值的方法:一、异常值检测异常值的检验有很多种方法,最常见的是图示法,也有使用分析方法进行探索。箱盒图:实验研究时经常使用,非常直观的展示出异常数据。散点图:研究X和Y的关系时,可直观展示查看是否有异常数据。描述分析:可通过最大最小值等各类指标大致判断数据是否有异常。
其它:比如结合正态分布图,频数分析等判断是否有异常值。二、异常值判定上述已经说明异常值会带来严重的影响,扭曲数据结论等。那么首先需要设定异常值的标准,然后再对其进行处理。异常值的判定标准并不统一,更多是通过人为标准进行设定,SPSSAU提供以下几类判定规则:1、设置为Null值;此类处理最简单,而且绝大多数情况下均使用此类处理;直接将异常值“干掉”,相当于没有该异常值。
如果异常值不多时建议使用此类方法。2、填补;如果异常值非常多时,则可能需要进行填补设置,SPSSAU共提供平均值,中位数,众数和随机数共四种填补方式。建议使用平均值填补方式。