登录
首页 » Python » 201411149222244

201411149222244

于 2015-10-23 发布 文件大小:1KB
0 381
下载积分: 1 下载次数: 13

代码说明:

  随便下载一篇中文的文本文档,通过这个程序可以将文档进行分词处理,还能够统计词语出现的次数(To download a Chinese text documents, through this program can be word processing document, will also be able to statistics the number of occurrences of words and phrases)

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • JAVAe-book
    MVC构架,JAVA电子留言簿,又喜欢的可以下载(MVC framework, JAVA E-book, but also like to download)
    2008-05-14 13:23:49下载
    积分:1
  • word_split
    这个一个基于逆向最大匹配的分词程序,语料规模比较小。(The maximum matching based on the reverse of the sub-term process, relatively small-scale corpus.)
    2009-06-22 15:04:24下载
    积分:1
  • bped.cpp
    bped source code inc plus
    2010-02-08 21:05:48下载
    积分:1
  • wordsegmentation
    一种基于自动机的分词方法,可进行中文分词及统计(Based method of automatic machine word)
    2011-09-21 11:38:57下载
    积分:1
  • Reader
    在中文分词之前,要对文档进行读取,本代码是实现了从磁盘读取的任务。(In the Chinese word prior to reading the document, the code is read from the disk to achieve the task.)
    2013-09-10 11:09:28下载
    积分:1
  • raw
    说明:  10个中文分词数据集,用于训练中文分词模型(Ten Chinese Word Segmentation Datasets for Training Chinese Word Segmentation Model)
    2021-01-06 11:48:53下载
    积分:1
  • lucene
    java中lucene的源代码,用于文本分类的一个很好的工具,是由一个著名的语言研究者编写的(lucene code for java)
    2009-03-30 17:28:22下载
    积分:1
  • LS-SVMlab1.5aw
    一种基于matlab的支持向量机小例子,用于预测,LS(A matlab-based support vector machine small example for the prediction, LS)
    2009-03-13 09:49:36下载
    积分:1
  • ictclas
    中科院的分词系统ictclas源码,自由开放的源码,很好(ictclas code)
    2009-11-21 11:05:05下载
    积分:1
  • tranditionized
    中文简繁转换 GreenBrowser/TheWorld2.0插件(Tranditional Chinese Script Conversion GreenBrowser/TheWorld2.0 Plug-in)
    2010-02-24 19:20:05下载
    积分:1
  • 696516资源总数
  • 106914会员总数
  • 0今日下载