数据挖掘为什么要对数据进行分类
发布网友
发布时间:2022-04-20 06:11
我来回答
共2个回答
热心网友
时间:2023-07-17 22:33
对数据进行分类主要是方便存储和读取,不同类型的数据的大小或者说是存储长度是不一样的,分开后无论是读取还是存储都要方便和快捷很多。没有数据语义的知识,就找不出任意的分类属性集的分层序。
含义分层:定属性集中每个属性不同值的个数自动地产生概念分层。具有最多不同值的属性放在分层结构的最低层。一个属性的不同值个数越少,在所产生的概念分层结构中所处的层次越高。在许多情况下,这种启发式规则都很顶用。在考察了所产生的分层之后,如果必要,局部层次交换或调整可以由用户或专家来做。
分类数据是统计数据的一种。指反映事物类别的数据。如人按性别分为男、女两类。 分类数据是离散数据。分类属性具有有限个(但可能很多)不同值,值之间无序。例子包括地理位置、工作类别和商品类型。有很多方法产生分类数据的概念分层。
热心网友
时间:2023-07-17 22:34
不太明白您说的分类是什么意思?是在数据预处理阶段,还是挖掘的目的?
如果在数据预处理阶段,可能是只对某个领域的数据进行挖掘,从而可以得出更置信的结论;
如果是挖掘目的,也就是模型的输出,这就比较好理解了。