发布网友 发布时间:2022-05-16 19:09
共1个回答
热心网友 时间:2023-11-25 09:55
摘要笔记是学习石胜飞老师编著的《大数据分析与挖掘》一书的知识点总结,如有侵权,速删。数据集类型结构化数据存储在关系数据库中,每条记录包含若干属性。半结构化数据使用标签来标识数据的每个元素,具有一定的层次结构。包括XML、JSON数据。非结构化数据包括文档、音频、图像、视频等,没有预定义数据模型的数据。数据属性的类型属性,也被成为维或者特征。结构化和半结构化的数据都可以提取出描述对象的属性信息。非结构化数据没有包含属性信息,进行分析和挖掘前,要对其进行特征提取。标称属性类似于标签,用于识别和分类,取值通常是枚举类型,不具有顺序关系和比较关系,也成为分类属性。设置标称属性值时,注意取值的互斥性和完备性。序数属性不仅包含标称属性的特征,同时还反应了对象之间的等级和顺序。也就是说,序数属性值不仅代表类别,也代表按属性排列的高低、大小、先后顺序。数值属性(1)区间标度属性包括温度、成绩、日期等,用相同的单位尺度度量,属性的值是有序的。没有真正的零值,零值只是测量尺度上的一个测量点,所以区间标度属性值之间的比率没有意义。(2)比率标度属性包括年龄、重量、收入等,有固定零点,除了具有区间标度属性的所有特性外,可以进行比率计算咨询记录 · 回答于2021-11-04标称属性可能的取值通常是可以枚举的亲,您好,您的问题我已经看到了,正在整理答案,打字需要时间,请稍等一会儿。谢谢!笔记是学习石胜飞老师编著的《大数据分析与挖掘》一书的知识点总结,如有侵权,速删。数据集类型结构化数据存储在关系数据库中,每条记录包含若干属性。半结构化数据使用标签来标识数据的每个元素,具有一定的层次结构。包括XML、JSON数据。非结构化数据包括文档、音频、图像、视频等,没有预定义数据模型的数据。数据属性的类型属性,也被成为维或者特征。结构化和半结构化的数据都可以提取出描述对象的属性信息。非结构化数据没有包含属性信息,进行分析和挖掘前,要对其进行特征提取。标称属性类似于标签,用于识别和分类,取值通常是枚举类型,不具有顺序关系和比较关系,也成为分类属性。设置标称属性值时,注意取值的互斥性和完备性。序数属性不仅包含标称属性的特征,同时还反应了对象之间的等级和顺序。也就是说,序数属性值不仅代表类别,也代表按属性排列的高低、大小、先后顺序。数值属性(1)区间标度属性包括温度、成绩、日期等,用相同的单位尺度度量,属性的值是有序的。没有真正的零值,零值只是测量尺度上的一个测量点,所以区间标度属性值之间的比率没有意义。(2)比率标度属性包括年龄、重量、收入等,有固定零点,除了具有区间标度属性的所有特性外,可以进行比率计算