V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
witcat
V2EX  ›  程序员

词条/关键词匹配的时机

  •  
  •   witcat · May 17, 2023 · 770 views
    This topic created in 1081 days ago, the information mentioned may be changed or developed.
    现在在做一个小软件,其中大概有这样一个功能:
    有若干的文章(约 1500 篇),还有一些关键词(大约 400 多个)。
    文章中如果出现了关键词,就把这些关键词转换成跳转链接,就是类似维基百科里那种效果。
    目前是在创建文章还有更新文章时,会用 ahocorasick 和关键词列表进行匹配。

    但是一个问题是关键词也在持续更新,这样比较早的文章中就没有新的关键词。
    我想了两个办法:
    1. 当一个文章超过一段时间没人访问,下次访问时会更新关键词列表
    2. 设置一个定时任务,每天都把所有文章的关键词重新匹配一遍

    2 的方法,我个人不是太喜欢定时任务。1 的话个人感觉倒是可以,但感觉会不会过度设计了。
    有人做过类似的功能可以给一些建议吗?
    1 replies    2023-05-18 14:44:22 +08:00
    Yuan2One
        1
    Yuan2One  
       May 18, 2023
    其实大部分系统也就是这么设计的,但是考虑到只有 1500 篇文章,那么如果你新词更新频率并不高,其实可以只使用 2 吧
    蹲一个大佬解答
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2576 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 06:59 · PVG 14:59 · LAX 23:59 · JFK 02:59
    ♥ Do have faith in what you're doing.