发布网友 发布时间:2022-05-24 16:01
共1个回答
热心网友 时间:2023-10-19 21:29
连续数值离散化大致可分为:1)有监督(supervised)和2)无监督(unsupervised)两类。
一篇经典文献可供参考:J. Dougherty, et al., Supervised and Unsupervised Discretization of Continuous Features, ICML, 1995.
我尝试过上面的一些算法,总的感觉是,如果特征离散化之后的处理和类别相关,比如需要对数据分类、或者预测(如ID3)。那么有监督的方法效果更好。