首页   注册   登录
JCZ2MkKb5S8ZX9pq

JCZ2MkKb5S8ZX9pq

V2EX 第 318343 号会员,加入于 2018-05-24 15:59:10 +08:00
今日活跃度排名 9278
JCZ2MkKb5S8ZX9pq 最近回复了
扫码加群做私域
1 天前
回复了 xtx 创建的主题 程序员 何同学新一期的视频创意真的很好。
好像已经过了找到自己 id 就特别高兴的年纪……
微软的 powertoys 有新增一个搜索工具,类似 listary 和 everything,比较像 mac 的 spotlight,还在陆续完善中,有兴趣可以试试。
2 天前
回复了 choice4 创建的主题 MongoDB Mongo 分组查询
说出来你可能不信,我没用过 sql……
不过 mongo 的话,有 aggregate + $group,具体你可以根据需求搜看看。
python cook book 好像有提过这个
但以我平时写的那些小破代码来说,可读性和直观程度更加重要一些。优不优化区别不大,真搞到需要优化了,我应该也能有预算找人帮我整个重构了。
5 天前
回复了 dtgxx 创建的主题 MongoDB mongodb 导入数据怎么破
@dtgxx 嗯,看了下的确没有先 compound 然后再转换的方法。那就等于全部数据要预处理,那是怎么都快不起来了。
去重的话感觉也是先建非 unique 的 index,然后排序去重能快一点。不过你这个量是满夸张的。
5 天前
回复了 dtgxx 创建的主题 MongoDB mongodb 导入数据怎么破
@dtgxx 是用

createIndex({name:1,gender:1,age:1})
如果是这种是可以重复的吧?

加了{unique: true}的话倒不清楚,没用过这个,查询会更快吗?
我去试试看这个。

也可以考虑初期先导入,用起来再说,日后慢慢去重做 unique 吧。
5 天前
回复了 dtgxx 创建的主题 MongoDB mongodb 导入数据怎么破
@dtgxx 20 楼说的看了眼,学到了。但感觉不管哪种去重,查找的花销总归是难免的,不如先全部丢进去再说了。可以以后慢慢处理。

> 但是联合唯一索引在导入数据之后有重复数据就无法创建了
这个没有看懂,如果是 mongo 自带的 index 不是可以重复的吗?
5 天前
回复了 dtgxx 创建的主题 MongoDB mongodb 导入数据怎么破
需求没看很懂,唯一索引是建一个单独的字段,还是 createIndex ?
如果碰到重复,处理逻辑是什么样的?

另外有个比较基本的差别,insert_many 比逐条插入要快很多。可以考虑先 createIndex 然后批量导入,最后再说处理重复,不知道能不能行。
@2exhjx 本来我以为发表这种“何不食肉糜”式的评论的,都是真的不知人间疾苦。结果点进您信息一看,前些天还在讨论黑果…… 厉害厉害
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3131 人在线   最高记录 5168   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 11:21 · PVG 19:21 · LAX 04:21 · JFK 07:21
♥ Do have faith in what you're doing.