想自学数据挖掘需要什么基础?
发布网友
发布时间:2022-04-23 19:04
我来回答
共2个回答
热心网友
时间:2022-04-19 02:28
我先介绍下我自己,我不是搞纯数学专业的,我是REDHAT LINUX“红帽子”公司的资深系统级工程师。我也做过数据挖掘方面的工作!为一个在甲骨文的朋友搞一些数据方面的工作。所以为了应付我也大概突击了下,才发现这门学科有窍门!
首先,我要说的是我觉得你是一名在校大学生!Data Mining不是你想的那么简单,他不单单和数学有关系,还包括了计算机领域的诸多学科。还有社会工程学、逻辑学等文科和理科的交叉学科!他是一门庞大的体系。你要是真想学我只能给你指条比较快的成才之路,后面的东西自己慢慢学都赶趟!慢慢充实自己!大学四年好好利用!学无止境!
既然是数据分析那你的高等数学必须要过硬,别着急这只是你的其他学科的基础课。其次是概率与统计,这才是正科,大学那点玩意就是糊弄人的,你要多看这方面的书。这个一定要学好!线性必须要会要精通。因为数据划分是数据挖掘里最重要的一个环节。这个就是线性范畴里的了。也要精通,学会线性分析你就发现你就学会了很多。数学有这三个底子就可以了。数学分析不要看了。因为那只是高数的延伸!
计算机你一定要懂。数据库你必须得学会。三大数据库ORACLE.SQL.MYSQL原理基本类似触类旁通!
还有就是培养你的思维,尽量缜密敏捷。这样才可以发现数据中的不同!因为有的数据挖掘是计算机处理的。有的则是纸面上的。所以必须学会记录
好了,就先这么多了。你学会了这几个就是你进军下一步的基础,这几个就够你学一阵子的了。
祝你好运哥们!
热心网友
时间:2022-04-19 03:46
数据挖掘涉及的内容比较泛,机器学习、数据挖掘、人工智能,但实际上这些知识大多是相通的,《机器学习实战》这本书是启蒙书里很好的一本了,该有的都有,难度较小,有理论有实践,可以较快的对各种知识有个大概的了解,但是想要长期在这个行业发展,还需要学习更多的知识。
等你对这些有了大致的了解之后,好好看看《统计学习方法》这本书,深入地了解一下理论部分,看一看核心部分的数学模型,看一看如何算法实现,着重理解一下拉格朗日微分法和拉格朗日对偶,解决等式约束和不等式约束很有用,这个也是使用智能算法尝试解决NP完全问题的一个结合点。除了看书以外,其他时间全部用在学习编程上,python常用的numpy、matplotlib、scipy、sklearn、nltk这些你都要大致了解怎么用,推荐你看看图灵程序设计丛书里的《python学习手册》、《python自然语言处理》、《python科学计算》,至少要知道怎么定义类、方法、属性,常用模块里有哪些好用的方法。
关于数据挖掘的相关学习,推荐CDA数据师的相关课程,课程内容兼顾培养解决数据挖掘流程问题的横向能力以及解决数据挖掘算法问题的纵向能力。要求学生具备从数据治理根源出发的思维,通过数字化工作方法来探查业务问题,通过近因分析、宏观根因分析等手段,再选择业务流程优化工具还是算法工具。点击预约免费试听课。