前言

最近有要用到 PHP 压缩文件为 tar.gz 格式的场景,一开始的时候在网上找了一圈,发现有用的解答比较少。自己琢磨了半天实现了,分享一下我的解决方法,抛砖引玉。

阅读全文 »

昨晚在知乎上看到这个话题,猛然发现,我已经快毕业一年了。一时想了很多,差点再一次失眠,总的来说,生活有在变好,但槽点也是不少。

关于生活

工作之后,有了稳定的收入来源,在离公司不远的地方租了个小单间。单间虽小,该有的家具都有。远离了学生时代的集体宿舍之后,睡眠质量上升了不止一个档次。

阅读全文 »

新的机遇

早些年的 PT 站能否称得上大站,主要看它是否有 0day 渠道首发和压制水平。在奶油的年代,情况却有了不同。随着那些大战逐渐沦陷,蓝光碟的 0day 渠道越来越少,而每个站的压制水平其实很难去评价好坏,对于普通人的「瞎眼」来说,也显得不是那么重要。

阅读全文 »

困难重重

尽管开张第一天就感受到用户的热情, 但是我们同时还听到了很多不友好的声音。有的人在「兵马俑BBS」上跟帖质疑奶油葡萄是钓鱼站,新注册的用户中也有不少人在群聊区吐槽资源太少,观光了一把就再也没登录过。

而且生不逢时,刚开张没多久,就遇到了「PT 寒冬」,各站为求自保纷纷关闭开放注册 & 邀请注册,奶油葡萄自然也是跟着怂了,仅留下校内通道。记得当时,每次有用户感慨站点用户少、资源少的时候,lsj 就顺道感慨一次「生不逢时」。

阅读全文 »

写在前面的话

这篇文章的主要目的是为了科普,是为了帮助大家从 0day 名辨别视频资源的质量好坏。不管是为了混迹 PT 圈,还是为了提高自己的观影感受,亦或是单纯为了提高姿势水平,这篇文章都值得细心的品读。

阅读全文 »

PT 是什么

PT 是 Private Tracker 的简称,其实也属于 BT 的一种,有关 BT 的内容,我们在此不详述,请自行谷歌。

BT 下载的理念是让人人都成为服务器,下载的同时也进行上传,这样参与进来的人越多,下载的速度也越快。如果下载的人数足够多,往往可以达到网络带宽的峰值。

阅读全文 »

故事背景

又是一个不那么美好的星期三,和同事感慨了下「又回到年前加班的时光」,便相约去食堂吃「煮泡面」。不巧的是,这天还下雨了,为故事又增添了些压抑的气氛。和同事撑着伞,一路避开地上的水坑来到了食堂。本以为下雨天,来食堂用膳的人会少,现实却活生生地打了脸,「煮泡面」窗口已经排起了五条小长龙。

阅读全文 »

啰嗦的话

在「南洋 PT」(下文用「奶油葡萄」替代)成立一周年的时候,我说「是时候写点东西纪念下了」,当时因为还没有自己的博客,所以就搁置了;在奶油葡萄两周年的时候,我说「是时候该写点东西了」,也忘了什么原因导致的迟迟没有动笔。一直推迟到现在(第四个年头),我才下定决心要唠叨唠叨。

阅读全文 »

算法简介

翻阅过不少机器学习相关书籍的目录,基本上都会将「分类」作为前一两章进行介绍。而分类算法中,最成熟也是最容易上手的算法当属 k - 近邻算法(kNN)。

它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前 k 个最相似的数据,这就是 k- 近邻算法中 k 的出处,通常 k 是不大于 20 的整数。最后,选择 k 个最相似数据中出现次数最多的分类,作为新数据的分类。

阅读全文 »

前言

最近项目有遇到一个国际化的需求,要把项目中的中文(非注释性质)找出来,以便给专业翻译公司翻译。幸运的是,项目所用框架是支持多语言的。然而,在二次开发的过程中,由于没有强制要求「充分使用语言包」的开发规范,程序猿开发的时候为了省事,自然是「随心所欲」。因此,项目中的所有文件都有可能包含中文。

对于目录结构不深、代码文件数较少的项目来说,人工去翻阅代码进行匹配是一种可行的方式。不巧的是,日积月累的业务需求导致项目并不满足上述条件。都说 Python 强大,前阵子也学了些皮毛,刚好可以小试牛刀。

阅读全文 »