概述
K最近邻分类算法
该方法是一种接近无反馈的方法
优点
更适合交叉或重叠较多的待分类样本集的分类问题
缺点
当分类的各样本容量不平衡时,计算结果不准确(但可以采用赋权值的方法改进)
原理
<b><br></b><br>KNN算法基于这样一个假设:如果在一个特征空间中,一个样本的k个最邻近样本中的大多数样本属于某一个类别,<br>则该样本也属于这个类别。
参考资料链接https://blog.csdn.net/weixin_44356285/article/details/86431650
通过物品画像计算样本个体间的距离或相似度来确定最邻近,算法的时间复杂度跟样本的个数直接相关
在KNN算中,最核心的一点是怎么定义物品之间的距离,常规的计算物品距离的方法有:欧式距离、曼哈顿距离、切比雪夫距离、杰卡德系数、夹角余弦、皮尔逊系数。计算例子的参考链接:https://mp.weixin.qq.com/s/9F_BRgnhAxP-nALtBdIZpg<br>