1
eric 2012-07-23 16:45:14 +08:00 1
NLTK 的 word_tokenize 就能很方便的实现。
http://nltk.org/ |
2
stackpop OP @eric 的确好强大,就是我想要的东西。之前打算用C++ 写,后来朋友建议用python,代码简洁得多,果然py强大~难怪国外好多大学CS第一门编程课改成python了,呵呵
|
3
fanzheng 2012-07-24 00:08:04 +08:00
如果只是出现次数的话用split然后counter()嘛,官方模块文档里面的counter()
|
4
from0tohero 2012-07-26 18:39:19 +08:00 1
NLTK最好没有之一~
|