如何处理非正态数据r语言
发布网友
发布时间:2023-07-27 06:21
我来回答
共1个回答
热心网友
时间:2024-11-16 07:55
当作正态处理: 凡中度及以下偏度的数据(包括重尾分布),涉及均值比较或回归系数估计的,样本量超过10个,可以当作正态处理。原因是中心极限定理。 如果实验过程是随机化顺序的,这时候这时候对均值的检验(例如使用t检验或F检验)是随机化检验方法的近似,不需要考虑正态性问题。
2.
变换为正态: 当数据严重偏离正态,或者比较的是方差(即与均值无关),这时中心极限定理帮不上忙,就最好通过数据变换转化为正态分布。 变换一般是幂变换。 分为经验法和Box-cox法(过程能力指数CpK计算时还常用Johnson变换)。 经验法就是求数据的2次方,或1/2次方,或1/4次方,或-1次方,或取Ln。看哪一种变换后近似正态。 Box-cox法是原理相同但更精确、更正式的方法。
3.
针对专门分布的方法: 例如针对相应指数族分布使用广义线性模型。