V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
c3538378
V2EX  ›  自然语言处理

有没有熟悉 NLP、话题提取的老司机,请给几个关键字提示

  •  
  •   c3538378 · 2016-01-29 21:39:12 +08:00 · 5446 次点击
    这是一个创建于 3003 天前的主题,其中的信息可能已经有所发展或是发生改变。

    要实现这样一个识别功能:

    一篇关于黄晓明和 AB 结婚的文章,全文并无出现「明星」两个字,
    但要提取出话题:明星结婚

    一篇关于历史上某个人物的文章,全文也没有出现中国、古代史这样的字眼,
    但需要提取出话题:中国古代史

    感觉有点像 Naive Bayes Classifier ,但好像又不是?
    哪个老司机丢几个关键字我去搜索一下?

    7 条回复    2016-01-30 08:58:02 +08:00
    billlee
        1
    billlee  
       2016-01-29 21:46:15 +08:00
    Collaborative filtering?
    c3538378
        2
    c3538378  
    OP
       2016-01-29 21:50:08 +08:00
    @billlee 这不能算是协同过滤吧
    iyuyue
        3
    iyuyue  
       2016-01-29 22:04:55 +08:00   ❤️ 1
    analogical reasoning task

    我觉得这些 topics 还是需要事先分好的吧

    附上一个上课的 ppt , http://www.inf.ed.ac.uk/teaching/courses/nlu/lectures/nlu_l03-lda-2x2.pdf
    c3538378
        4
    c3538378  
    OP
       2016-01-29 22:34:46 +08:00
    @iyuyue 感谢

    topics 是预先分好的,但是数量会比较多。
    另外找到个: Latent dirichlet allocation 好像也是用来解决这类问题的?
    iyuyue
        5
    iyuyue  
       2016-01-29 22:48:25 +08:00
    LDA 是一个具体的模型。 NLP 很多地方都有用的。
    xuwenhao
        6
    xuwenhao  
       2016-01-30 01:28:01 +08:00
    Topic Model
    ljdawn
        7
    ljdawn  
       2016-01-30 08:58:02 +08:00
    LDA 吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1161 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 23:45 · PVG 07:45 · LAX 16:45 · JFK 19:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.