发布网友 发布时间:2022-04-22 15:35
共1个回答
热心网友 时间:2023-10-20 05:25
决策树标签分成10类的方法是:使用决策树构建然后对决策树进行节点分割来分为10类
步骤1:将所有的数据看成是一个节点,进入步骤2。
步骤2:从所有的数据特征中挑选一个最优数据特征对节点进行分割,使得分割后的子集有一个在当前条件下最好的分类,进入步骤3。
步骤3:生成若干孩子节点,对每一个孩子节点进行判断,如果满足停止*的条件,进入步骤4否则,进入步骤2。
步骤4:设置该节点是子节点,其输出的结果为该节点数量占比最大的类别。
决策树的特点是:
优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。
缺点:可能会产生过度匹配的问题(需要剪枝)。 适用数据类型:数值型和标称型。
决策树在对中间节点进行*的时候,是选择最优*结果的属性进行*,决策树使用信息增益或者信息增益率作为选择属性的依据。
信息增益表示划分数据前后信息发生的变化,获得信息增益最高的特征就是最好的选择。