V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  forty  ›  全部回复第 23 页 / 共 41 页
回复总数  808
1 ... 19  20  21  22  23  24  25  26  27  28 ... 41  
275 天前
回复了 Davic1 创建的主题 深圳 有的房东真是大畜啊
没有遇到提灯定损,就算是庆幸了!

我在租房,如果是二房东的,或者是村里的,水电费都是加倍的收。
275 天前
回复了 SergeGao 创建的主题 程序员 求推荐稳定不晃动的显示器
不能换桌子的话,可以安装一种墙上支架,这样就算桌子塌了显示器都不晃
学到了 1 个新知识: 布隆过滤器
感谢大家!

OP 的这个数据量,用哈希表也足够处理了。也可以先布隆一遍,找出一定不存在重复的,再用哈希排查不确定是否重复的。

化整为零,先用哈希进行分类,再在分类内部进行除重(省内存,时间换空间)。

用普通的编程语言,普通的 PC 即可,不依赖其他数据软件。

203 亿 介于 2^34 与 2^35 (2 的 35 次方) 之间,按 2^35 算,因此 35 比特就能表示行号,可以给它 5 个字节。

用哈希进行分类,分多少个类就写多少个文件,只记录 MD5 和行号。
全部分类文件都写完之后,依次载入 1 个分类文件到内存,用哈希表除重,输出哈希重复(应删除的行)的行号,问题就基本解决了。

如果分 65536 个类,则每个分类下约有 50 多万个数据,每个分类文件约 10MB 。

如果分 256 个类,则每个分类下约有 8 千万个数据,每个分类文件约 1.6GB ,老 PC 也能干。

如果分 16 个类,则每个分类下约有 13 亿个数据,每个分类文件约 26GB ,现在的普通 PC 都可以胜任。

如果强迫症觉得可能有哈希冲突,那就可以再加 1 个不同的哈希算法,对这个数量级来说是基本不用考虑 MD5 冲突的。
全部境外,套上 cf ,证书都不用操心了
279 天前
回复了 wildlynx 创建的主题 分享发现 中国银行真鸡贼
我旧的中行卡单次最高可转 100W, 单日限额好像 500W. 如果是新开卡,限额就很低了。
@emma3 好像是 10G
你这个有后台吗?通过哪种方式把图片上传到 R2 ?
跟现实打交道太深,就会涌入各种牛鬼蛇神,失控,要么管理成本爆炸,要么放任它乱。58 太多坑了,上面是骗子集散地。
把电报号发给对方
很简单,把验证信息放入另一个不经过 cloudflare 的域名站点。
主体内容走 cf, 验证信息走另外通道。
281 天前
回复了 cs5117155 创建的主题 JavaScript 现在 H5 有全面支持蓝牙协议了吗
没问题,黄龙江一派全都带蓝牙了
@zanpo CDN 现在挺普及的,用户是跟 CDN 通信,CDN 再跟服务器通信,CDN 其实是中间人,所以有时候你需要让通信内容不被 CDN 知道,就需要多加密一层。比如,敏感内容,你不想被 CDN 检测和谐。
1 ... 19  20  21  22  23  24  25  26  27  28 ... 41  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5755 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 39ms · UTC 01:53 · PVG 09:53 · LAX 17:53 · JFK 20:53
Developed with CodeLauncher
♥ Do have faith in what you're doing.