首页   注册   登录
swulling

swulling

V2EX 第 22404 号会员,加入于 2012-06-19 18:32:26 +08:00
今日活跃度排名 3599
9hills的马甲
swulling 最近回复了
一起 [给] 我,少了一个字大家都看不懂了
8 小时 54 分钟前
回复了 ll5270 创建的主题 问与答 大家都在外漂了多久了,对于未来有什么打算?
40 多岁还在写代码的人大有人在,年轻人要多接触社会。

计划干到 45 岁退休
1 天前
回复了 meisen 创建的主题 分享发现 新版本 QQ
catalyst 看起来不错啊,不过得升级到最新版才能使用
每年国务院发的表都不一样,而且并没有什么规律。
所以自己维护一套数据即可,每年加个提醒别忘了更新下一年的。

也不需要什么爬虫,人工录入下就完了。
1 天前
回复了 YIN123 创建的主题 宽带症候群 小白请教下关于 5 类网线的问题
买线别选六类线,没必要。超五即可
1 天前
回复了 YIN123 创建的主题 宽带症候群 小白请教下关于 5 类网线的问题
四芯的锅,正常的八芯五类线家庭场景短距离千兆不是问题。
1 天前
回复了 huyinjie 创建的主题 MongoDB 请教百万条数据在 MongoDB 中的去重问题
写一个简单的 Python 脚本:

1. 顺序读出所有数据的对应 Field,放入 Python 的 Dict,Key 为 Field 值,Value 为 ObjectID
2. 放入之前判断是否已经有对应的 Key,如果有,和对应的 ObjectID 的数据进行合并写回 MongoDB 即可。此处也可以不直接写回,而是将重复的 ObjectID 写到别的什么地方,最后再统一处理

百万条没有任何问题,估计内存也就消耗 1G 这个量级。而且怎么可能用几个小时,顺序读取速度可以拉满的
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3221 人在线   最高记录 5168   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 11:01 · PVG 19:01 · LAX 04:01 · JFK 07:01
♥ Do have faith in what you're doing.