问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

minitab数据处理报错?

发布网友 发布时间:2022-04-25 00:04

我来回答

3个回答

热心网友 时间:2023-10-16 16:40

在我之前的文章中,我们了解了一个很小的数据输入错误是如何残忍地破坏统计分析工作的。

如果那没有让你感到惊讶,这篇也许将会引起你足够的重视。

数据输入错误的频率高达27%,即使是使用保守的“复式”方法来记录数据,每个数据值输入两次,这种情况也不容乐观。

针对这种情况,我们能做些什么呢? 难道是供养古希腊女神,用错觉、愚昧来掩盖不计后果的错误吗?

首先,一些老派的建议是不可替代的,深吸一口气,卷起袖子,反复检查每一个观测数据。

但假如你没有时间和精力这样去做呢?

这里有三个简单的方法,我们可以通过使用Minitab迅速找出数据的异常值,以确保它们不会影响你的分析。

1.使用图形化汇总

如果你有测量(连续型)数据,我们要养成一个习惯,在分析之前,先使用图形化汇总来检查数据,而不是将数据视为神圣不可侵犯的东西。我们可以选择统计>基本统计量>图形化汇总。



通过查看最小值和最大值,以确保它们在正常范围内的。在箱线图中,对于你数据中的任何异常值都会用星号进行突显。你可以把光标移动到星号标识的点,以确定其数据值和在工作表中的位置。然后通过调查以确定它是否是一个错误,如果是错误,那么在分析数据之前需要更正或删除异常值。

在这个例子中,显示了胆固醇值的汇总信息,Minitab软件把2098标志为异常值。注意,直方图出现了偏态分布,这是由一个异常值造成的。

2运行计数

如果你有类别数据,比如列中有一个文本值,那么计数是对你来说是很好的工具。使用统计>表格 >单变量计数来汇总所有列的离散值。



如果你要执行的分析要求是二项数据,比如是/否或通过/失败,而且遇到了类似错误,那么这个计数工具将非常有用。



当你尝试运执行双比率检验或二元Logistic回归分析时,可能会遇到这个问题。你很确定在列中只有两种类型的值,但是任何一个多余的空格或字符、小写或大写的误拼或其他错误都会产生另一个不同的值。

3.设定公式

通过使用Minitab计算器中的条件语句设定公式,你可以标记工作表中超乎寻常的数据。

假如您想识别出在C1列数以万计的胆固醇总体中,数值小于100的“可疑值”。右键单击相邻的列(C2)和,选择列>>公式>>对列设定公式。在公式下的文本框中选择条件函数。然后填写下面的表达式:



列条件语句中的第一个值和条件是你需要Minitab软件来寻找的内容;在逗号后面的第二个值,是显你想要显示的满足条件的结果。文本值用双引号表示。

当你点击确定后,将会在相邻列(C2)中标记满足C1条件的任何值,而在当前指定情况下,任何值都小于100

热心网友 时间:2023-10-16 16:41

数据输入错误的频率高达27%,即使是使用保守的“复式”方法来记录数据,每个数据值输入两次,这种情况也不容乐观。
针对这种情况,我们能做些什么呢? 难道是供养古希腊女神,用错觉、愚昧来掩盖不计后果的错误吗?
首先,一些老派的建议是不可替代的,深吸一口气,卷起袖子,反复检查每一个观测数据。
但假如你没有时间和精力这样去做
这里有三个简单的方法,我们可以通过使用Minitab迅速找出数据的异常值,以确保它们不会影响你的分析。
1.使用图形化汇总
如果你有测量(连续型)数据,我们要养成一个习惯,在分析之前,先使用图形化汇总来检查数据,而不是将数据视为神圣不可侵犯的东西。我们可以选择统计>基本统计量>图形化汇总。
通过查看最小值和最大值,以确保它们在正常范围内的。在箱线图中,对于你数据中的任何异常值都会用星号进行突显。你可以把光标移动到星号标识的点,以确定其数据值和在工作表中的位置。然后通过调查以确定它是否是一个错误,如果是错误,那么在分析数据之前需要更正或删除异常值。
在这个例子中,显示了胆固醇值的汇总信息,Minitab软件把2098标志为异常值。注意,直方图出现了偏态分布,这是由一个异常值造成的。
2运行计数
如果你有类别数据,比如列中有一个文本值,那么计数是对你来说是很好的工具。使用统计>表格 >单变量计数来汇总所有列的离散值。
如果你要执行的分析要求是二项数据,比如是/否或通过/失败,而且遇到了类似错误,那么这个计数工具将非常有用。
当你尝试运执行双比率检验或二元Logistic回归分析时,可能会遇到这个问题。你很确定在列中只有两种类型的值,但是任何一个多余的空格或字符、小写或大写的误拼或其他错误都会产生另一个不同的值。
3.设定公式
通过使用Minitab计算器中的条件语句设定公式,你可以标记工作表中超乎寻常的数据。
假如您想识别出在C1列数以万计的胆固醇总体中,数值小于100的“可疑值”。右键单击相邻的列(C2)和,选择列>>公式>>对列设定公式。在公式下的文本框中选择条件函数。然后填写下面的表达式:
列条件语句中的第一个值和条件是你需要Minitab软件来寻找的内容;在逗号后面的第二个值,是显你想要显示的满足条件的结果。文本值用双引号表示。
当你点击确定后,将会在相邻列(C2)中标记满足C1条件的任何值,而在当前指定情况下,任何值都小于100:

热心网友 时间:2023-10-16 16:41

统计学为分析实际生产中常见的数据提供了有用的分析方法,评估这些数据有助于做出正确而有益的决定。通过一种有组织的方法来评估观察到的数据,它可以帮助研究人员避免得出错误结论,并做出对产品的质量不明智甚至危险的判断。

统计为面对不确定性时的决策提供方法和工具,我很喜欢统计学家C.R.劳先生的一句话“在理性的世界里,所有的判断都是统计”,甚至把它作为我微信的个性签名。

我虽然很钟爱统计学,但我不是盲目的信徒,因为平常分析时马克吐温有一句名言经常在我脑中回荡:“世界上有三种谎言:谎言,该死的谎言,以及统计数据。”这句名言是有道理的,下面我以“正态分布”为例来说明我的观点。

正态分布为何如此重要
作为Minitab技术支持,我很欣慰我的学员和客户问我一个问题:老师,我的数据非正态,我该如何分析?正如本文标题所言,这是一个错误的问题,但仍然令我欣慰,为什么呢?因为当您问到这个问题的时候,说明在分析的时候做了思考。很多统计工具和质量工具在使用时都有严格的前提条件需要满足,其中之一就是——数据必须服从正态分布。

比如说,我们在使用以下常用质量工具和统计工具时,需要满足正态要求:

1. 控制图

2. 过程能力分析

3. 单t、双t、配对t检验等

4. 方差分析

5. 残差分析

为什么说这是一个错误的问题
正态数据做分析上手很快,但世事无常,我们经常面临的数据都是非正态,下面我们以过程能力分析为例。

能力分析之前需要做正态检验,这一点从过程能力指数的公式中大家应该都明确。

用6σ作为过程变异的度量-要求正态性。

随着质量人员统计意识的提高,对于能力分析之前先做正态性检验,大家基本没问题。

关键的问题是,如果正态性检验后发现数据非正态了,该如何去处理?这时候,很多同学首先想到的办法就是转换数据分布,把非正态数据转换成服从正态分布的数据,对吗?

过程能力分析案例
为了防止工具的滥用,我们通过一个具体的案例来进一步说明。假如,我们现在想对某一药品的有效成分含量进行过程能力分析,规格下限360mg/ml,规格上限370mg/ml,数据如下:

正如前面所言,过程能力分析先做正态性检验,我们来看一下正态性检验结果:

有效成分含量正态性检验的P值小于0.005,那它肯定比0.05要小,故数据非正态。其实,我们之前总结了能力分析的一些思路(如下图):
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
梦见关在拘留所里的人又出了交通事故,是什么意思? ...我朋友前阵子撞死了人,没有违规,当时立即报案了,现在在拘留所... 醉驾出事故,车已经给修了,现在已经进拘留所十多天了,什么时候能判... 朋友因为工地伤亡事故被拘留,现在已经25天了,赔偿金也付了10多天了... 江淮帅铃国4??加油发动机抖动冒黑烟是怎么回事? ...只换机油和格,现在5万公里了,请需要换些什么东西 诗经·国风·中谷有蓷原文、译文以及鉴赏 求解签 情缘 下签 条其啸矣。遇人之不淑矣。 解曰:孽缘遮眼 强栖双... 条其啸矣 如何将域解除? 大地鹰王摩托车太子150为什么上60以后震动大 太子摩托车150一般要多少钱那个牌子的性能比较好 spss中如何对非正态数据进行多因素分析 大地鹰王太子150摩托车高压包跳火太弱什么原因? minitab软件怎样恢复初始设置 摩托车总是坏火花塞是什么原因呢?我的是大地鹰王摩托车太子150火花塞坏了 非正态分布的PPK怎样解读,合格率怎样计算? 大地鹰王太子车质量怎么样 Minitab软件在六西格玛绿带培训课程中会有相关内容么?怎么应用? 在毒APP鉴别靠谱吗,有双球鞋想找专业人士帮忙鉴别一下真伪? 请问大地鹰王150系列车怎么样 如何用MINITAB进行过程能力分析 大地鹰王太子车150怎么比125还便宜?150单缸单排,125却是双缸双排,动力方面哪谁更好,该买哪 多重线性回归分析各样本中有非正态数据,如何进行分析? 大地鹰王太子车质量怎么样 想买这车 pin码在哪里设置? Minitab软件在六西格玛管理起到什么作用? 摩托车专家请进,关于大地鹰王150cc街车、 如果数据不是正态分布用什么方法检验过程能力 大地鹰王太子摩托车很垃圾吗? 大地鹰王150g-2发动机的双缸交叉工作是什么意思? 大地鹰王250太子VS轻骑铃木风暴太子150 minitab中不是正态分布的数据怎么处理为正态分布 如何将非正态数据转换成正态分布数据 大地鹰王150g-2这车发动机的双缸是并行工作还是交叉工作? 大地鹰王DD150-5太子摩托车的链条问题 非正态数据分布如何做测量系统分析?直接按正态数据处理的话,所得分析结果是高估了还是低估了系统? sim卡pin密码怎么设置 门锁卡住了怎么办? 如何设置sim卡pin密码 门锁的锁舌卡住了怎么办? 门锁卡住了咋办啊,求指点 防盗锁卡死了打不开 门锁打不开怎么办? 我的云服务器被攻击了, 为什么远程登录不了我的云服务器? 家里锁芯发卡 转不动 怎么解决? 如何在我的云服务器下建立一个博客 密码锁卡住了打不开怎么办 我的云服务手机号码已经注销了,登陆密码也忘记了怎么办???