网页结果
按时间搜索
搜索历史
  • 使用python进行汉语分词

    目前我常常使用的分词有结巴分词、NLPIR分词等等最近是在使用结巴分词,稍微做一下推荐,还是蛮好用的。一、结巴分词简介利用结巴分词进行

    发布时间:2014-10-20 09:53:31
  • 用几十行代码实现python中英文分词

    说到分词大家肯定一般认为是很高深的技术,但是今天作者用短短几十行代码就搞定了,感叹python很强大啊!作者也很强大。不过这个只是正向最...

    发布时间:2013-01-05 14:35:14
  • 用Python写一个简单的中文分词

    解压后取出以下文件:训练数据:icwb2-data/training/pku_ training.utf8测试数据:icwb2-data/testing/pku_ test.utf8正确分词结果:icw...

    发布时间:2013-03-28 09:48:31
  • 大文件的排序和去重 超级简单的实现

    有一道校招生的面试题,是要给一个很大的文件(不能全部放内存,比如1T)按行来排序和去重。一种简单解决方案就是分而治之,先打大文件分词

    发布时间:2014-07-17 09:56:40
  • 使用python和xapian构建高速检索引擎

    首先弄明白几个概念:Documents 、terms and posting在信息检索(IR)中,我们企图要获取的项称之“document”,每一个document是被一个te

    发布时间:2014-01-17 09:41:49
  • Python进阶01 词典

    列表是Python里的一个类。一个特定的表,比如说nl = [1,3,8],就是这个类的一个对象。我们可以调用这个对象的一些方法,比如 nl append(15)。 我们要介绍一个新的类,词典 (dictionary)。与列表相似

    发布时间:2014-06-23 10:37:32
  • nltk 之 snowball 提取词干

    机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取。所以我们要用到snowball。下面说一下snowball 提取词干的两种方法

    发布时间:2013-11-06 16:08:46
  • Python进阶教程01 词典

    基础教程介绍了基本概念,特别是对象和类。进阶教程对基础教程的进一步拓展,说明Python的细节。希望在进阶教程之后,你对Python有一个更全

    发布时间:2014-09-10 09:33:18
  • 廖雪峰历时3个月打磨出价值1980的数据分析教程,终终终于免费啦!

    大家好,我是PythonTab网站站长。在我们刚刚走过的2016年, 我们收到很多网友的建议,其中很多建议就是希望增加视频教程,但是鉴于我本人

    发布时间:2017-01-11 10:58:58
  • 飞桨带你了解:基于百科类数据训练的 ELMo 中文预训练模型

      在NLP世界里  有一支很重要的家族  英文叫做LARK(LAnguage Representations Kit),  翻译成中文是语言表示工具箱  目前LARK

    发布时间:2019-06-06 16:58:32