V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
alexchinatests
V2EX  ›  Elasticsearch

es 检索电影字幕文件应该用什么分词

  •  
  •   alexchinatests · 2020-01-02 16:35:37 +08:00 · 2549 次点击
    这是一个创建于 1547 天前的主题,其中的信息可能已经有所发展或是发生改变。

    es 检索电影字幕文件应该用什么分词 现在我用的是中文分词 导致一段话被截取了好几个好几个词 查询出来很不准确~

    第 1 条附言  ·  2020-01-02 17:16:24 +08:00
    已解决 使用的 match_phrase ღ( ´・ᴗ・` )比心
    效果页面: https://www.chuangkeba.net/subtitle
    3 条回复    2020-01-03 09:17:03 +08:00
    THESDZ
        1
    THESDZ  
       2020-01-02 17:05:03 +08:00
    看分词插件,得分计算方式
    alexchinatests
        2
    alexchinatests  
    OP
       2020-01-02 17:12:44 +08:00
    已解决 使用的 match_phrase ღ( ´・ᴗ・` )比心
    JCZ2MkKb5S8ZX9pq
        3
    JCZ2MkKb5S8ZX9pq  
       2020-01-03 09:17:03 +08:00 via iPhone
    这个我也想过,想抓了配截图玩。
    不过有版权问题又没啥盈利,就没实践。
    用 OCR 其实电视剧动漫也能搞。
    可能还需要评分和投稿,过滤出高质量的。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3647 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 10:44 · PVG 18:44 · LAX 03:44 · JFK 06:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.