问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

做数据库挖掘,必须买数据挖掘软件吗?如果买的话,哪些比较便宜呢?请大家...

发布网友 发布时间:2024-10-02 07:07

我来回答

1个回答

热心网友 时间:2024-10-19 09:56

数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。
1. 数据挖掘能做什么?

1)数据挖掘能做以下六种不同事情(分析方法):

· 分类 (Classification)

· 估值(Estimation)

· 预言(Prediction)

· 相关性分组或关联规则(Affinity grouping or association rules)

· 聚集(Clustering)

· 描述和可视化(Des cription and Visualization)

2)数据挖掘分类

以上六种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘

· 直接数据挖掘

目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以

理解成数据库中表的属性,即列)进行描述。

· 间接数据挖掘

目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系



· 分类、估值、预言属于直接数据挖掘;后三种属于间接数据挖掘

3)各种分析方法的简介

· 分类 (Classification)

首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分

类模型,对于没有分类的数据进行分类。

例子:

a. 信用卡申请者,分类为低、中、高风险

b. 分配客户到预先定义的客户分片

注意: 类的个数是确定的,预先定义好的

· 估值(Estimation)

估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的

输出;分类的类别是确定数目的,估值的量是不确定的。

例子:

a. 根据购买模式,估计一个家庭的孩子个数

b. 根据购买模式,估计一个家庭的收入

c. 估计real estate的价值

一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的

连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运

用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。

· 预言(Prediction)

通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用

于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。

预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时

间后,才知道预言准确性是多少。

· 相关性分组或关联规则(Affinity grouping or association rules)

决定哪些事情将一起发生。

例子:

a. 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则)

b. 客户在购买A后,隔一段时间,会购买B (序列分析)

· 聚集(Clustering)

聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先

定义好的类,不需要训练集。

例子:

a. 一些特定症状的聚集可能预示了一个特定的疾病

b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群

聚集通常作为数据挖掘的第一步。例如,"哪一种类的促销对客户响应最好?",对于这一

类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,

回答问题,可能效果更好。

· 描述和可视化(Des cription and Visualization)

是对数据挖掘结果的表示方式。

2.数据挖掘的商业背景

数据挖掘首先是需要商业环境中收集了大量的数据,然后要求挖掘的知识是有价值的。有

价值对商业而言,不外乎三种情况:降低开销;提高收入;增加股票价格。

1)数据挖掘作为研究工具 (Research)

2)数据挖掘提高过程控制(Process Improvement)

3)数据挖掘作为市场营销工具(Marketing)

4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management)

3.数据挖掘的技术背景

1)数据挖掘技术包括三个主要部分:算法和技术;数据;建模能力

2)数据挖掘和机器学习(Machine Learning)

· 机器学习是计算机科学和人工智能AI发展的产物

· 机器学习分为两种学习方式:自组织学习(如神经网络);从例子中归纳出规则(如决

策树)

· 数据挖掘由来

数据挖掘是八十年代,投资AI研究项目失败后,AI转入实际应用时提出的。它是一个新兴

的,面向商业应用的AI研究。选择数据挖掘这一术语,表明了与统计、精算、长期从事预

言模型的经济学家之间没有技术的重叠。

3)数据挖掘和统计

统计也开始支持数据挖掘。统计本包括预言算法(回归)、抽样、基于经验的设计等

4)数据挖掘和决策支持系统

· 数据仓库

· OLAP(联机分析处理)、Data Mart(数据集市)、多维数据库

· 决策支持工具融合

将数据仓库、OLAP,数据挖掘融合在一起,构成企业决策分析环境。

4. 数据挖掘的社会背景

数据挖掘与个人预言:数据挖掘号称能通过历史数据的分析,预测客户的行为,而事实上

,客户自己可能都不明确自己下一步要作什么。所以,数据挖掘的结果,没有人们想象中

神秘,它不可能是完全正确的。

客户的行为是与社会环境相关连的,所以数据挖掘本身也受社会背景的影响。比如说,在

美国对银行信用卡客户信用评级的模型运行得非常成功,但是,它可能不适合中国
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
找几本一流的小说。类型' 完结什么的无所谓. 不要幼稚就好 沈阳职高学校排名 沈阳哪个公办职高和中专好 沈阳有哪些职高学校比较好? gpw一代和二代的区别有哪些 罗技gpw一代和二代区别介绍 第一代和第二代的区别 gpw二代和一代有什么区别 二代和一代区别详情分享 设张举措的意思设张举措的解释设张举措接龙 设张的成语设张的成语是什么 人字地砖铺法怎么找平方 1990年农历六月初九晚上丑时出生的女孩是什么命,什么时候结婚好呢_百度... 农历1990年6月9日是什么命?请高人指点 如何修复路由器电源系统不工作的问题? 家庭中央净水机安装的位置应选择哪里?可否安装在室外? 兰州深兰西太华珠宝有限公司怎么样? 五行属火可以戴绿幽灵吗? 怎么修复路由器里面的13.1.1.0 梦到很小的老鼠幼崽 梦见很小的老鼠幼崽是什么预兆 四大名酒有哪些?中国白酒四大香型 jquery 中$("button").button();是什么意思,有什么用? 还有就是怎么写... 中国四大香型酒有哪些,都是老百姓甄选的好酒(中国名酒四大香型) 关于jQuery,$(":button") 中的冒号是什么意思? 中国白酒四大香型(中国白酒四大香型酿造工艺) 请问在广州白云区哪一方位租房子,可以离十三行等批发市场近点并且交通方... 中国四大香型酒有哪些,都是老百姓甄选的好酒 ...click(function () {...})中的:button是什么意思啊 中国四大香型酒有哪些,都是老百姓甄选的好酒(中国四大香型酒有哪些... 成人脉搏一分钟跳多少下算正 男主角很冷很强很腹黑很霸道 海尔按键锁怎样解除? 木块在玻璃面和木桌面上哪一个摩擦力大,为什么? 风水罗盘购买 cf的管理人员什么时候下班 cf研修班是什么意思 菠菜有哪些食用功效价值?切记菠菜不能这样吃! 雷厉风行一路闯持久奋斗数十载什么生肖 白酒中重要的“四香”是哪四香?(白酒四香型) 痔疮喷血怎么止血 用副词比较级造句四个,用形容词造句四个。急急急急!!!跪求! 痔疮大出血如何止血 我想在 赢顺模拟版 (模拟期货软件)上建一个页面能同时看多个品种_百 ... 我是一名女新主播,如何吸引土豪来刷礼物?土豪是不是更注重才艺?_百度... 瓷砖背覆胶能直接用来贴瓷砖吗 我是贵州凯里的考生,想去重庆补习文化可以嘛?学的是一样的嘛?高考卷... 徐州公办卫校是那个 新沂钟吾卫校跟徐州着边的卫校哪边比较好啊?帮忙讲解下,急啊.不知道哪... 明天重庆出发去贵州凯里最快的交通方式是哪种? 你们觉得新沂市的钟吾中学怎么样? 凯里学院录取分数线2024年是多少分(附各省录取最低分) 新沂市钟吾中学学校简介