毕业一年,我的状态还好吗?
奶油葡萄往事(三)
奶油葡萄往事(二)
奶油科普第二期 —— 如何一眼看出视频质量好坏
奶油科普第一期 —— 萌新基础知识
一碗泡面引发的血案
奶油葡萄往事(一)
k-近邻算法
算法简介
翻阅过不少机器学习相关书籍的目录,基本上都会将「分类」作为前一两章进行介绍。而分类算法中,最成熟也是最容易上手的算法当属 k - 近邻算法(kNN)。
它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前 k 个最相似的数据,这就是 k- 近邻算法中 k 的出处,通常 k 是不大于 20 的整数。最后,选择 k 个最相似数据中出现次数最多的分类,作为新数据的分类。