问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

为什么k临近算法不能处理特征很多的数据集?

发布网友 发布时间:2022-05-05 02:48

我来回答

1个回答

热心网友 时间:2022-04-19 04:39

机器学习中常常要用到分类算法,在诸多的分类算法中有一种算法名为k-近邻算法,也称为kNN算法。
一、kNN算法的工作原理
二、适用情况
三、算法实例及讲解
---1.收集数据
---2.准备数据
---3.设计算法分析数据
---4.测试算法

一、kNN算法的工作原理
官方解释:存在一个样本数据集,也称作训练样本集,并且样本中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系,输入没有标签的新数据后,将新数据的每个特征与样本集中的数据对应的特征进行比较,然后算法提取样本集中特征最相似的数据(最近邻)的分类标签。一般来说,我们只选择样本集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数,最后,选择k个最相似的数据中出现次数最多的分类,作为新数据的分类。
我的理解:k-近邻算法就是根据“新数据的分类取决于它的邻居”进行的,比如邻居中大多数都是退伍军人,那么这个人也极有可能是退伍军人。而算法的目的就是先找出它的邻居,然后分析这几位邻居大多数的分类,极有可能就是它本省的分类。

二、适用情况
优点:精度高,对异常数据不敏感(你的类别是由邻居中的大多数决定的,一个异常邻居并不能影响太大),无数据输入假定;
缺点:计算发杂度高(需要计算新的数据点与样本集中每个数据的“距离”,以判断是否是前k个邻居),空间复杂度高(巨大的矩阵);
适用数据范围:数值型(目标变量可以从无限的数值集合中取值)和标称型(目标变量只有在有限目标集中取值)。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
陈八两面馆的什么面最好吃? 杭州湾跨海大桥可以骑行吗 杭州湾跨海大桥上能骑车吗? ...不知道可不可以骑自行车,又需要做哪些准备,谢谢各位资深人士了... 激光祛痘坑的效果如何? 口述:3个闺密分享1个“软饭男” 骚气文案暗示-推荐65句 三个男人怎么晒朋友圈 任钊的介绍 请问德阳青依江路口到德阳中级人民法院坐几路公交车 有没有图片素材的网址? k近邻算法特征值非数字 k近邻算法的概念介绍 一道高中数学题目,由下表可知这里的下表中的数据怎么来的,K²的观察值k计算公式是什么 什么是k-最近邻算法 K-MEANS算法的终止条件 K平均算法的发明历史 K平均算法的介绍 化学平衡常数K的计算公式 下调存款准备金率和存贷款基准利率意味着什么 北京工作居住证办理条件2022 工作居住证办理条件北京 2021 直角三角形外接圆半径公式 直角三角形内切圆半径公式 直角三角形内切圆 直角三角形内接圆公式 屋子如何保暖 已知直角三角形三边,如何求内切圆面积 分分合合合合分,湖里鱼虾几不亲,夏天经常住一起,冬季各往东西奔。(打一动物)。 直角三角形内切圆的半径计算公式是什么? 合久必分,分久必合 猜一生肖? 请问小米帐号是多少 小米帐号是多少? 小孩子是说话早了好?还是晚了好?有什么区别吗? 想知道为什么有的孩子说话早,有的孩子就很晚才能说话呢? 说话晚的小孩和早的小孩有什么区别啊! 说话早和说话晚的小孩有什么区别?用甄益乐孩子会开口早吗? 宝宝说话是早还是晚,这和哪些事情有关? 有些宝宝说话早,有些宝宝说话晚这是怎么回事呢? 小孩子说话早还是晚,到底和什么因素有关系呢? 宝宝早说话,是不是比晚说话的聪明 英语写的名人珍惜时间的小故事 寻找关于如何珍惜时间的英语短文 谁能给我一篇关于珍惜时间教育意义的英语小故事,要小学难度的。万分感谢! 用写英文珍惜时间的短文 珍惜时间 英文故事 英语作文,举美国人珍惜时间的两个例子 文章开头 珍惜时间高中英语演讲稿 珍惜时间的英语作文 求关于珍惜时间 故事50~100字 什么是股票定价委托交易方式