最近我在维基百科上完成了一些数据挖掘方面的任务。它由这些部分组成:解析enwiki-pages-articles.xml的维基百科转储;把类别和页存储到Mon...
项目发展到今天,已经日渐稳定,慢慢的陆陆续续有些人坐不住了,提出了离职,有些我会努力去挽留了,甚至想出各种办法来给他创造留下的理由...
我最近写了几篇比较严肃的博客,是关于一些沮丧的事情,结果我开始有些忧郁。很严重。所以,我想应该说些比较轻松的事情。我要做的就是数落
前几日回学校与学弟妹分享创业心得,时间结束前有几组人马上台分享自己的创业点子,有些人说的信心满满,有些人则感觉有些紧张,当然时间太
首先弄明白几个概念:Documents 、terms and posting在信息检索(IR)中,我们企图要获取的项称之“document”,每一个document是被一个te
拥抱 unix 哲学 每个程序员入门的第一堂和第二堂课应该是和 unix 哲学相关的内容,简言之就是:做一件事,做好它。具体点:小即是美
Linux系统中的wget是一个下载文件的工具,它用在命令行下。对于Linux用户是必不可少的工具,我们经常要下载一些软件或从远程服务器恢复备份...
本文将会着重介绍防御XSS攻击的一些原则,需要读者对于XSS有所了解,至少知道XSS漏洞的基本原理,如果您对此不是特别清楚,请参考这两篇文...