V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
jinbakei
V2EX  ›  问与答

用程序自动给文章分类怎么做?

  •  
  •   jinbakei · 2013-08-04 21:23:10 +08:00 · 3366 次点击
    这是一个创建于 4158 天前的主题,其中的信息可能已经有所发展或是发生改变。
    业余在做一个机器抓取网上文章在整合发布的网站。现在想用机器学习之类的技术能把文章按不同的内容进行分类,请问应该怎么做?谢谢!
    4 条回复    1970-01-01 08:00:00 +08:00
    likai
        1
    likai  
       2013-08-04 21:28:56 +08:00 via Android   ❤️ 1
    中文分词作tag
    jinbakei
        2
    jinbakei  
    OP
       2013-08-04 21:59:16 +08:00
    @likai 请问能具体一些么?求指点明路啊谢谢~
    maxint64
        3
    maxint64  
       2013-08-04 22:17:59 +08:00
    分词是第一步,之后是为文章建立模型,然后是做聚类。
    binux
        4
    binux  
       2013-08-04 22:23:07 +08:00
    标记,分词,找个库扔进去训练就完了
    如果觉得觉得麻烦,手动提取特征tag
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   844 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 21:32 · PVG 05:32 · LAX 13:32 · JFK 16:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.