正确的数据计划如何建立?
发布网友
发布时间:2022-04-24 21:44
我来回答
共1个回答
热心网友
时间:2023-10-12 02:52
我如何建立正确的数据计划?数据科学协会(Association for Data Science)*迈克尔•沃克(Michael Walker)表示:“数据科学的最高水平是按照科学标准设计实验,提出正确的问题,收集正确的数据集。”然后你得到结果并解释它。”
我如何建立正确的数据计划?数据科学是一种结构化的过程,它从一个明确的目标开始,引出假设的问题,最终达到我们的目标。数据科学家常常站在数据之上,而不考虑需要分析和回答的问题。数据科学项目必须有项目目标和健全的建模目标。不知道自己想要什么的数据科学家最终只能做他们不想做的分析。
我如何建立正确的数据计划?大多数数据科学项目最终回答了“是什么”的问题,因为数据科学家分析手头的问题,而不是遵循理想的分析路径。数据科学就是利用大数据来回答所有“为什么”的问题。数据科学家应该积极地分析给定的数据集,并通过合并以前未合并的数据集来回答以前未回答的问题。
为了避免这种情况,数据科学家应该专注于正确的分析,这可以通过清楚地了解实验、变量和数据的准确性,清楚地知道他们想从数据中得到什么来实现。这简化了前面使用满足假设的统计方法回答业务问题的过程。伏尔泰说过:“判断一个人是看他提出的问题,而不是他给出的答案。”对于任何企业实现其数据科学目标来说,首先清楚地识别问题是极其重要的。
如何建立正确的数据计划?这才是优秀的数据分析师必备技能,大多数数据科学家专注于分析的技术方面。科学家认为,建立一个成功的机器学习模型是最成功的。但这只是成功的一半,它必须确保模型的预测有效,你能处理好吗?如果您还担心自己入门不顺利,可以点击本站其他文章进行学习。