问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

回归树的优化指标是什么

发布网友 发布时间:2023-05-18 02:32

我来回答

2个回答

热心网友 时间:2023-09-20 11:30

对于回归树来说是处理连续型变量和分类型变量,所以不再是像之前分类树的不纯度指标了(1.信息熵,2.基尼系数),而是采用下面三种衡量回归树分枝质量的指标
1)输入"mse"使用均方误差mean squared error(MSE),父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失
2)输入“friedman_mse”使用费尔德曼均方误差,这种指标使用弗里德曼针对潜在分枝中的问题改进后的均方误差
3)输入"mae"使用绝对平均误差MAE(mean absolute error),这种指标使用叶节点的中值来最小化L1损失属性中最重要的依然是feature_importances_,接口依然是apply, fit, predict, score最核心。

(mae在0.20等更新的版本里可能才会有)
这些计算的方法在我们使用sklearn的时候是无法干预的

其中N是样本数量,i是每一个数据样本,fi是模型回归出的数值,yi是样本点i实际的数值标签。所以MSE的本质,其实是样本真实数据与回归结果的差异。在回归树中,MSE不只是我们的分枝质量衡量指标,也是我们最常用的衡量回归树回归质量的指标,当我们在使用交叉验证,或者其他方式获取回归树的结果时,我们往往选择均方误差作为我们的评估(在分类树中这个指标是score代表的预测准确率)。在回归中,我们追求的是,MSE越小越好。
(这个回归树的score接口返回的并不是mse)

其中u是残差平方和(MSE * N),v是总平方和,N是样本数量,i是每一个数据样本,fi是模型回归出的数值,yi是样本点i实际的数值标签。y帽是真实数值标签的平均数。R平方可以为正为负(如果模型的残差平方和远远大于模型的总平方和,模型非常糟糕,R平方就会为负),而均方误差永远为正。

值得一提的是,虽然均方误差永远为正,但是sklearn当中使用均方误差作为评判标准时,却是计算”负均方误差“(neg_mean_squared_error)。这是因为sklearn在计算模型评估指标的时候,会考虑指标本身的性质,均方误差本身是一种误差,所以被sklearn划分为模型的一种损失(loss),因此在sklearn当中,都以负数表示。真正的均方误差MSE的数值,其实就是neg_mean_squared_error去掉负号的数字

热心网友 时间:2023-09-20 11:31

criterion
对于回归树来说是处理连续型变量和分类型变量,所以不再是像之前分类树的不纯度指标了(1.信息熵,2.基尼系数),而是采用下面三种衡量回归树分枝质量的指标
1)输入"mse"使用均方误差mean squared error(MSE),父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失
2)输入“friedman_mse”使用费尔德曼均方误差,这种指标使用弗里德曼针对潜在分枝中的问题改进后的均方误差
3)输入"mae"使用绝对平均误差MAE(mean absolute error),这种指标使用叶节点的中值来最小化L1损失属性中最重要的依然是feature_importances_,接口依然是apply, fit, predict, score最核心。

(mae在0.20等更新的版本里可能才会有)
这些计算的方法在我们使用sklearn的时候是无法干预的

其中N是样本数量,i是每一个数据样本,fi是模型回归出的数值,yi是样本点i实际的数值标签。所以MSE的本质,其实是样本真实数据与回归结果的差异。在回归树中,MSE不只是我们的分枝质量衡量指标,也是我们最常用的衡量回归树回归质量的指标,当我们在使用交叉验证,或者其他方式获取回归树的结果时,我们往往选择均方误差作为我们的评估(在分类树中这个指标是score代表的预测准确率)。在回归中,我们追求的是,MSE越小越好。
(这个回归树的score接口返回的并不是mse)

其中u是残差平方和(MSE * N),v是总平方和,N是样本数量,i是每一个数据样本,fi是模型回归出的数值,yi是样本点i实际的数值标签。y帽是真实数值标签的平均数。R平方可以为正为负(如果模型的残差平方和远远大于模型的总平方和,模型非常糟糕,R平方就会为负),而均方误差永远为正。

值得一提的是,虽然均方误差永远为正,但是sklearn当中使用均方误差作为评判标准时,却是计算”负均方误差“(neg_mean_squared_error)。这是因为sklearn在计算模型评估指标的时候,会考虑指标本身的性质,均方误差本身是一种误差,所以被sklearn划分为模型的一种损失(loss),因此在sklearn当中,都以负数表示。真正的均方误差MSE的数值,其实就是neg_mean_squared_error去掉负号的数字。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
蒙牛为什么卖给中粮 只知道名字怎么找人的联系方式 谁能告诉我怎么在微博上找人啊? 新浪微博怎么找人啊? 雅思裸考一般能考多少分 高热病人应如何护理 检疫性有害生物 多少种 北半球气温最高和最低的月份分别为 北半球气温最高和最低的月份 一起又看流星雨中有一首歌歌词是:为什么你会出现在我的身边_百度... excel表格打开密码忘记怎么办 程序分析与操作分析的关系是什么 短毛狗狗的针梳排梳什么区别?这两种梳子必须都得有么?还需要别种的梳子吗? 日照有海吗 石臼港的解释石臼港的解释是什么 共享日语怎么说? 急需 不必,要完美(演讲稿) 初三 字数越多越好 ”不必要完美“的演讲稿 不必要完美的演讲稿范文分享 天刀经脉系统入门详解修为获取指南介绍 平安银行主动分期还是邀约分期好 银行邀请分期付款和自己分期付款之间的区别 三千鸦杀玄珠是不是阿满 和平精英新手有什么玩法技巧 和平精英游戏要领 和平精英有哪些游戏技巧呢? 和平精英有哪些玩法技巧 只给了用人单位本科毕业证,他们可以查到专科证明吗 汇交监管 监管平台功能 资料催交 悦纳怎么把转弯图像关掉呢 5岁宝宝耳朵上面红下面白是怎么了 喝酒后一只耳朵红一只白是怎么回事? 耳朵平白无故就又烫又红了,是有人在背后骂你。这种说法正确吗? 天龙八部2姜太公鱼钩在钓鱼的时候有什么用 水压与水流量的基本常识 我想问一下水的流量跟压力有关系吗?能通过减小水的流量来降低压力吗? 求压力和流量的关系 客房清扫的方法 伊朗属于哪个洲的国家? 红岩第25章概括200字 红岩第25章概括简述 腿上为什么会有淤青 淤青形成的原因和处理方法? 手机qq多余的账号怎么解除绑定? 消防控制室的荷载 消防通道可以承载多少吨 iPad2018pro可以用应用宝吗 三国志战略版应用宝版本苹果可以用吗? 信用卡逾期一天会有哪些影响 中国邮政储蓄银行小额贷款管理办法 怒火中烧拼音