故事背景

又是一个不那么美好的星期三,和同事感慨了下「又回到年前加班的时光」,便相约去食堂吃「煮泡面」。不巧的是,这天还下雨了,为故事又增添了些压抑的气氛。和同事撑着伞,一路避开地上的水坑来到了食堂。本以为下雨天,来食堂用膳的人会少,现实却活生生地打了脸,「煮泡面」窗口已经排起了五条小长龙。

阅读全文 »

啰嗦的话

在「南洋 PT」(下文用「奶油葡萄」替代)成立一周年的时候,我说「是时候写点东西纪念下了」,当时因为还没有自己的博客,所以就搁置了;在奶油葡萄两周年的时候,我说「是时候该写点东西了」,也忘了什么原因导致的迟迟没有动笔。一直推迟到现在(第四个年头),我才下定决心要唠叨唠叨。

阅读全文 »

算法简介

翻阅过不少机器学习相关书籍的目录,基本上都会将「分类」作为前一两章进行介绍。而分类算法中,最成熟也是最容易上手的算法当属 k - 近邻算法(kNN)。

它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前 k 个最相似的数据,这就是 k- 近邻算法中 k 的出处,通常 k 是不大于 20 的整数。最后,选择 k 个最相似数据中出现次数最多的分类,作为新数据的分类。

阅读全文 »

前言

最近项目有遇到一个国际化的需求,要把项目中的中文(非注释性质)找出来,以便给专业翻译公司翻译。幸运的是,项目所用框架是支持多语言的。然而,在二次开发的过程中,由于没有强制要求「充分使用语言包」的开发规范,程序猿开发的时候为了省事,自然是「随心所欲」。因此,项目中的所有文件都有可能包含中文。

对于目录结构不深、代码文件数较少的项目来说,人工去翻阅代码进行匹配是一种可行的方式。不巧的是,日积月累的业务需求导致项目并不满足上述条件。都说 Python 强大,前阵子也学了些皮毛,刚好可以小试牛刀。

阅读全文 »

为什么要迁移至 Hexo

早在刚开始选博客系统的时候,我就在 Wordpress 和 Hexo 之间犹豫不定,然后选择了 Wordpress。之前选择 Wordpress 的原因是「方便」,手上有空闲的 VPS,而且 lnmp 环境一键安装包那么完善,Wordpress 当博客跑起来简直不要太简单。

而 Hexo 相对来说,还是比较年轻的博客系统,虽然网上很多关于「如何在 GitHub 上搭建 Hexo 博客」的资料,但写博客的步骤相比 Wordpress 还是要繁琐一点。

阅读全文 »

前言

搭建 NAS 是一直都有的想法,也是之前设定的 18 年的新年挑战。由于各种事情,一直拖到上个黑五换了新电脑,这才购置了些「垃圾配件」,把 NAS 给组装起来。话不多说,下面介绍下我的 NAS 搭建之旅,抛砖引玉。

机箱

机箱选用的是乔思伯 C2,体积 200 x 224 x 270 $mm^3$,支持主板类型:ITX/Micro - ATX。配合立人硬盘架,小机箱内起码可以放 4 块笔记本硬盘。如果是硬盘狂魔,配合辰雨 ATX 电源挡板,再加 2 块硬盘也不是问题。我的存储盘用的之前闲置下来的机械盘,其中一块 1TB 的笔记本硬盘、一块 500GB 的笔记本硬盘、一块 1TB 的台式机硬盘。

阅读全文 »

前言

好久没有更新博客了,其实在后台已经写了好几篇草稿,但是一直没有时间整理,到时估计算跨年的博文了。2017 已经不知不觉地过去了,我也从在校的苦逼研究生成为了一个苦逼的程序猿。程序猿的苦大家应该都懂,至于研究生阶段是如何心塞的,那又是另外一件事了,后续把这段故事放上来乐呵乐呵。

一路走来,我之前的经历就像《爱情公寓》里一句经典台词,原话我已经记不太清了,大意是「当你辛辛苦苦地找到了开门的钥匙,兴高采烈地去开锁的时候,却发现锁被换了」,每次当我要做出选择的时候,我会一脸懵逼地发现,我已经没得选了。尽管计划永远赶不上变化,我还是决定要规划一下我的 2018。

阅读全文 »

计划路线

杭州是华东五日游的最后一站,留给杭州的时候也还算充裕,加上逛了这么多地方,其实有些审美疲劳,所以对杭州的景点啥的,我们也没有特别的执念,所以游玩节奏是比较随意的。

路线依然是在东东包,在店里的餐巾纸上制定的。一开始想去的地方还是蛮多的,像西溪湿地公园、浙大玉泉校区、灵隐寺、西湖(雷峰塔)还有宋城等著名景点,然而一查路线,这几个地方相距太远,根本没有合适的路线将它们串起来,所以也只好放弃一些。

阅读全文 »

计划路线

乌镇不大,目前可供游玩的主要是东栅/西栅,另外南栅/北栅还在修建,知名度不高,所以我们在制定路线的时候,也主要是考虑东西栅。因为我们前一天是在上海玩耍,第二天才从上海出发去乌镇,时间上来说,到了乌镇应该也就快下午了,时间比较仓促,所以我们一直在纠结到底选东栅还是西栅。经过很多次讨论,以及车次情况,最终决定的是早起坐车去乌镇,下午逛东栅,然后去西栅看夜景。

阅读全文 »

文件/目录管理

ls

列出目录内容命令为 ls,可以理解为 list 的缩写。有以下三种常用方法,结果所列出的文件会显示成不同的颜色,不同颜色对应于不同的文件类型

1
2
ls -l /tmp    #列出/tmp目录下的内容,等同于ll
ls -a /tmp #列出/tmp目录下的内容,包括隐藏文件
类型 颜色 类型 颜色
目录 深蓝 链接文件 浅蓝
一般文件 灰色 设备文件 黄色
压缩文件 红色 可执行文件 绿色
阅读全文 »