V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐工具
RoboMongo
推荐书目
50 Tips and Tricks for MongoDB Developers
Related Blogs
Snail in a Turtleneck
channg01
V2EX  ›  MongoDB

请教 mongodb 优化

  •  
  •   channg01 · 2019-04-09 11:21:03 +08:00 · 11834 次点击
    这是一个创建于 1837 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我的 mongo 中有 800 万条数据大概 13 个 G

    我的一条查询大概是这样

    查询这个人的数据分页

    db.events.find({"actor.login": 'name'}).sort({"created_at": -1}).skip(200).limit(20)

    一条查询要好几分钟。。

    小前端不太会优化,求帮助

    11 条回复    2019-04-22 15:50:50 +08:00
    fox1955
        1
    fox1955  
       2019-04-09 11:26:18 +08:00
    加个索引啊老铁
    EPr2hh6LADQWqRVH
        2
    EPr2hh6LADQWqRVH  
       2019-04-09 11:29:46 +08:00 via Android
    如果你就想要结果而不想知道为什么的话,把 created_at 换成_id 目测能够好得多了
    brickyang
        3
    brickyang  
       2019-04-09 11:29:54 +08:00 via iPhone   ❤️ 1
    skip 太多会影响性能。分页最好是每次查询的最后一条记录的 _id,下一批分页的查询用 { $gt/$lt: _id } 配合 limit。
    channg01
        4
    channg01  
    OP
       2019-04-09 11:39:59 +08:00
    @fox1955 加了 db.events.createIndex({"actor.login":1}) 这样是吧
    channg01
        5
    channg01  
    OP
       2019-04-09 11:40:47 +08:00
    @avastms 没啥感觉改变啊
    @brickyang 好好好
    ft28142
        6
    ft28142  
       2019-04-09 11:48:01 +08:00
    @brickyang 正解,正确的方式是不要用 skip + 索引
    EPr2hh6LADQWqRVH
        7
    EPr2hh6LADQWqRVH  
       2019-04-09 11:52:03 +08:00 via Android
    可能你这数据集还是太稀疏了,
    两个方案,一个是加普通的复合索引,created_at 和 actor.login,就按这个顺序

    另一个,专门索引,索引项 created_at,选项填一个 partialFilterExpression,就是你 actor.login 的查询条件,再给索引专门起一个名字

    你这个情景,我感觉应该第二个方案可能更合适
    rrfeng
        8
    rrfeng  
       2019-04-09 12:04:45 +08:00
    加个索引就行 {actor.login:1, created_at: -1}
    menyakun
        9
    menyakun  
       2019-04-09 12:43:09 +08:00
    事实上 skip 还是会要从第 1 个遍历到第 200 个,但你这个查询 skip 的数目不是很大,应该不是这个问题。一般来说 sort 肯定是比较慢的,还特别吃内存,既然 sort 的字段是 created_at,那么用_id 也行
    version
        10
    version  
       2019-04-09 12:56:02 +08:00
    应该是是你单个 doc 文件太大了. mongodb 再分页时候会把整个 doc 都缓存放内存..这样容易爆..
    你可以分页查询只 返回_id 和 再单个主键去查询.这样会快点.
    这种也适合分页超过 第 20 万以上的时候..
    ScottAlone
        11
    ScottAlone  
       2019-04-22 15:50:50 +08:00
    @brickyang #3 如果是不是下一页,是下 N 页的话有什么办法吗...
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1317 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 17:33 · PVG 01:33 · LAX 10:33 · JFK 13:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.