问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

matlab留出法实现

发布网友 发布时间:2023-07-13 16:33

我来回答

1个回答

热心网友 时间:2023-09-12 21:11

留出法(hold-out)
方法:直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,即.在S上训练出模型后,用T来评估其作为测试误差,作为对泛化误差的估计。

以二分类任务为例,假定D包含1000个样本,将其划分为S包含700个样本,T包含300个样本,用S进行训练,如果模型在T上有90个样本分类错误,那么其错误率为(90/300)*100%=30%,精度为1-30%=70%。

注意事项:
(1)训练/测试集的划分要尽可能保持数据分布的一致性,避免因数据划分过程引入额外的偏差而对最终结果产生影响。例如在分类任务中至少要保持样本的类别比例相似,尝采用分层采样的方法,即采样过程中保留类别比例。
(2)即便在给定训练/测试集的样本比例后,仍存在多种划分方式对初始数据集D进行分割。因此,单次使用留出法得到的估计结果往往不够稳定可靠,在使用留出法时,一般要采用若干次随机划分、重复进行试验评估或取平均值作为留出法的评估结果。

在这里,还有一个窘境:若训练集S包含绝大多数样本,则训练处的模型可能更接近于用D训练出的模型,但由于T比较小,评估结果可能不够稳定准确,测试集小,评估结果的方差较大;若令测试集T多包含一些样本,则训练集S与差别更大了,被评估的模型与用D训练出的模型相比可能有较大的差别,从而降低了评估结果的保真性(fidelity)。

常见解决方法:将大约2/3~4/5的样本用于训练,剩余样本用于测试。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
写论文值得推荐的app 写论文app大全汇总 有啥好用又免费的文献查阅网站吗? 高仿苹果手机关机关不了机?是怎么回事?有那个朋友请告知! 高仿苹果6开机就是白屏黑苹果,关机关不了 怎么把电子相册保存到QQ空间相册 整个乡村音乐史上,最动人的25首歌 写给狗的歌 右侧肢体肌力4级是什么意思 肌力分级的评定标准 肌力4级是什么意思 母猪怀孕了打排卵针可以吗 matlab盗版如何用神经网络 我想问一下。猪便密要打什么针水? 山东临沂封城什么时候结束 为啥疫情不管控了,好多人阳了 今晚九龙坡区二郎疫情会封城吗 平邑今晚封城吗 北京今晚2022年11月24号大面积消杀是真的吗 曲柄摇杆机构和双摇杆机构有哪几点不同? 玻璃瓶养铜钱草底部放泥不好看 二本和士官学校哪个好 我来士官学校一年了,现在不想干了想回家 我该怎么办? 高考完被二本学校录取但还报了士官学校会影响吗? 报了个定向士官学校,8月13才出结果,现在不想去了,想报8月6的普通高校,怎么才能放弃定向士官的报 读二本好还是读定向士官好 早上健身好吗 ? 发动机工作时连杆发生异响的故障原因有哪些 三菱曲轴连杆损坏原因 从汽车结构来看,由曲柄连杆机构引起的异响常见的有哪些? 发动机曲柄连杆机构常见的故障有哪些? 求一张P过腮红的猫咪图片 PS人像腮红添加教程:PS怎么在人像照添加自然腮红? 中公优就业北京校区免费提供食宿是真的吗? 优就业成立时间? 想去中公优就业学UI设计,老师怎么样? 中公优就业真的包吃包住嘛?除了学费还有没有其他费用? 中公优就业成都校区和北京校区哪个好? 求书名,好想看 受孕月份是女孩子 受孕月份算男女准吗 牛蒡属于什么茶系 调侃天天做核酸的幽默句子 玉皇庙镇的各村委会 陕西省汉中市留坝县玉皇庙镇下辖村委会有哪些? 河南省驻马店市平舆县玉皇庙乡下辖村委会有哪些? 玉皇庙村车牌号是多少 为我造清洁的心原唱 2002世界杯有多少个参赛队? 全球变暖,日本面积这么小还是岛国,为何日本人却不担心会沉没? 沉入地幔的板块是否会聚集?是否 会形成《日本沉没》中那样的巨石体... 为什么最近总有日本沉没中国是否接受日本难民的问题出现呢?