奶油葡萄往事(一)
k-近邻算法
算法简介
翻阅过不少机器学习相关书籍的目录,基本上都会将「分类」作为前一两章进行介绍。而分类算法中,最成熟也是最容易上手的算法当属 k - 近邻算法(kNN)。
它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前 k 个最相似的数据,这就是 k- 近邻算法中 k 的出处,通常 k 是不大于 20 的整数。最后,选择 k 个最相似数据中出现次数最多的分类,作为新数据的分类。
Python 查找中文字符串
Wordpress 迁移至 Hexo
NAS 搭建之旅 —— 硬件篇
前言
搭建 NAS 是一直都有的想法,也是之前设定的 18 年的新年挑战。由于各种事情,一直拖到上个黑五换了新电脑,这才购置了些「垃圾配件」,把 NAS 给组装起来。话不多说,下面介绍下我的 NAS 搭建之旅,抛砖引玉。
机箱
机箱选用的是乔思伯 C2,体积 200 x 224 x 270 $mm^3$,支持主板类型:ITX/Micro - ATX。配合立人硬盘架,小机箱内起码可以放 4 块笔记本硬盘。如果是硬盘狂魔,配合辰雨 ATX 电源挡板,再加 2 块硬盘也不是问题。我的存储盘用的之前闲置下来的机械盘,其中一块 1TB 的笔记本硬盘、一块 500GB 的笔记本硬盘、一块 1TB 的台式机硬盘。