V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
gujianbo
V2EX  ›  程序员

我写了一篇有关搜索引擎原理与架构的文章

  •  
  •   gujianbo ·
    gujianbo · 2015-11-05 23:22:32 +08:00 · 4072 次点击
    这是一个创建于 3337 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如下:
    http://gujianbo.1kapp.com/search-engine-intro/

    博客没有谁来看,没有什么流量,原本写博客的目的就是跟大家交流讨论,让大家给我提意见,让大家都有所进步。我当然是坚持原创的东西

    17 条回复    2015-11-06 18:02:50 +08:00
    jeffjade
        1
    jeffjade  
       2015-11-06 00:47:52 +08:00
    不错,赞一个。

    请教一个关于针对百度搜索的问题可以? 用百度搜索总会有这样的尴尬: 比如你想搜索:“李易封”三个字。然而它的“智能化”算法,给你的结果都是“李易峰”。可是如想要就是'李易封',怎么办?

    之前有看到文章说可以用半角英文引号将需要搜索的内容包裹起来搜索;可是刚才也试了试,并不能 很好的工作。额~ 百度如此搞起‘贴心’,真的好么?
    HentaiMew
        2
    HentaiMew  
       2015-11-06 03:02:24 +08:00   ❤️ 1
    临时收藏了,有时间看看。
    @jeffjade 其实谷歌也会这样。不过百度更蠢一些,以前经常是点击了 仍然搜索“ XX ” 以后继续给你搜索“纠正”后的结果 ... 再点击仍然搜索“ XX ”之后依旧如此往返... 不同时间段在手机百度上都出现过这种情况。虽然现在基本没了。。。
    Andy1999
        3
    Andy1999  
       2015-11-06 03:11:05 +08:00 via iPhone
    百度:有钱就是爷

    索引我博客一堆 但是文不对题 有个毛线用
    simon7
        4
    simon7  
       2015-11-06 07:48:39 +08:00 via iPhone
    I SsVpnsogf
    ryd994
        5
    ryd994  
       2015-11-06 08:22:42 +08:00
    亲爱的用户,我是你爹
    realpg
        6
    realpg  
       2015-11-06 08:28:37 +08:00
    @jeffjade
    只要是你搜的那个词确实有结果,会提示
    已显示 XXX 的结果 仍然搜搜 YYY
    MeOO
        7
    MeOO  
       2015-11-06 08:48:23 +08:00
    楼主厉害!大赞!!
    aksoft
        8
    aksoft  
       2015-11-06 08:52:58 +08:00
    你是百度的?
    LittleLeopard
        9
    LittleLeopard  
       2015-11-06 09:11:30 +08:00
    没法评论,总是提示 微博登陆后 再评论。。
    jeffjade
        10
    jeffjade  
       2015-11-06 09:49:45 +08:00
    @aksoft 楼主是 Tencent 的(博客中 about 中有提到)。
    hitmanx
        11
    hitmanx  
       2015-11-06 09:59:38 +08:00
    写得通俗易懂,赞!
    hitmanx
        12
    hitmanx  
       2015-11-06 10:01:35 +08:00
    “谢霆锋的是谁的儿子?”这句话看得别扭死了。。
    pein
        13
    pein  
       2015-11-06 10:15:51 +08:00
    写得不错,值得学习,如果能再深化一点就好了。
    tankcong
        14
    tankcong  
       2015-11-06 11:34:42 +08:00
    看到李娜那个例子提到个性化,如果搜索引擎在搜索结果页提供主动地打分或者 LIKE/PREFER 这样的选项会不会更好的建立用户数据。因为如果只考虑搜索历史记录的话感觉不能完整的体现用户习惯。比如同主题的两篇文章,一个仔细研究了 1 小时,另一个打开扫了一眼就关了,两者明显不同。
    xiaoFen
        15
    xiaoFen  
       2015-11-06 11:39:18 +08:00
    谢谢分享,正想做相关毕设:)
    wavingclear
        16
    wavingclear  
       2015-11-06 11:40:43 +08:00
    @jeffjade 搜 李易封 -李易峰
    有一次点仍然搜索发现他们就是这么干的
    menc
        17
    menc  
       2015-11-06 18:02:50 +08:00
    @tankcong 会的,而且已经应用在工业界。

    现在学术界的前沿是考虑用户无意识的鼠标动作来判断他感兴趣的 classification ,就是你搜索“李娜”之后,你鼠标看似无意识的乱动和在每个结果处光标的动作被拿来用于分析你的搜索倾向,你体会一下。

    点击行为和浏览行为已经被研究的透透的了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5391 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 06:55 · PVG 14:55 · LAX 22:55 · JFK 01:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.