V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Kirscheis  ›  全部回复第 27 页 / 共 47 页
回复总数  940
1 ... 23  24  25  26  27  28  29  30  31  32 ... 47  
2017-06-17 17:05:07 +08:00
回复了 ethanlu 创建的主题 问与答 有没有什么语言可以对 PDF 有这样的操作?
这和语言没有关系,随便什么语言都可以。有 pdf 解析库的语言方便一些,比如 java、python。
当然,也可以先调用 poppler-utils 之类东西 extract,再用任何语言处理
2017-06-16 21:44:53 +08:00
回复了 Tunar 创建的主题 全球工单系统 腾讯云的这个邮件这样是正常么。。
联动 https://www.v2ex.com/t/368933
这两家是雇了同一个实习生吗。。
2017-06-14 23:06:45 +08:00
回复了 RqPS6rhmP3Nyn3Tm 创建的主题 iOS 发现 iOS 端的「Pythonista」这个软件可玩性非常高
确实很好用,以前用 iPhone 的时候很喜欢这个软件。以前最让我惊讶的是它还能支持图形界面。。总之就是很强
2017-06-11 22:33:17 +08:00
回复了 hiboshi 创建的主题 问与答 安卓端微信如何做到相对的匿名
1. xprivacy
2. 网络用跳板
3. 用外国 SIM
这三点做到,如果你不是打算拿来犯罪的话基本上已经足够匿名了
我想这确实是你少见多怪了。。如果反序列化之后不是个实例,那你期待它是个什么呢。。
2017-06-05 12:01:24 +08:00
回复了 coldwinds 创建的主题 问与答 腾讯企业邮箱域名要实名了,他家的邮件支持搬出去吗
工信部要求 6 月底前国内注册局注册的域名要实名。腾讯给你发这个消息意思不是企业邮要实名,而是提醒一下你如果到时候还没实名被 ServerHold 了域名解析不了你收不到邮件不是腾讯的锅。
不想被实名,域名迁到国外的服务商就行了
2017-06-04 15:51:33 +08:00
回复了 hanzichi 创建的主题 分享发现 真是醉了,在当当买书不容易啊 ...
ERR_CERT_REVOKED 不是没有 https,而是证书被吊销。你确定你没有干过手动吊销国内证书之类的事情的话,可能是网络有问题。。
2017-06-02 01:57:26 +08:00
回复了 fate0 创建的主题 Python Package 钓鱼
好奇有没有人测试过 homebrew cask
楼上的解决方案都谜之复杂。。我猜你想要的东西被称为“锁存器”。。
当然,音频接口输出的是有底噪的模拟信号,所以你还需要一个低通滤波器,一个施密特触发器
2017-05-27 04:05:53 +08:00
回复了 azuis 创建的主题 全球工单系统 阿里云服务器被超过 800PB DDoS 流量攻击
800PB 哈哈哈哈哈哈哈哈哈哈
楼主怕是遭遇了 22 世纪杀人网络
2017-05-15 22:34:48 +08:00
回复了 THEINSIGHT 创建的主题 奇思妙想 学校周边房屋白天分时租赁有前景吗?
pku 附近已经有很久了,叫 itopia
你也可以把她现男友的信息也挂到 blued 上啊。顺便再挂到 Jack'd,Zank,Grindr,Aloha... 上。。。hhhhhhhh
2017-05-05 23:01:52 +08:00
回复了 2232588429 创建的主题 问与答 有没有听久了耳朵不疼的耳机推荐?
hd650 和 px100 交替使用,目前每天戴耳机时间大于 14 小时,很少会痛
很多年了暂时没有发现听力下降的趋势,每年体检均正常
hook CreateProcessEx 然后一个个排查
2017-04-25 23:32:18 +08:00
回复了 cmlz 创建的主题 分享发现 澳门永辉肉松紫菜蛋卷,千万别买。
hhhhhh 这么一对比旁边那个“图片仅供参考”简直应景
2017-04-25 19:15:42 +08:00
回复了 fhefh 创建的主题 问与答 想把买的纸质书做成 PDF,求扫描仪推荐~~
不推荐自扫。。需要电子书不如直接下载一个。扫描书籍费事又费时,用自己的小扫描仪扫一本书基本上都要好几个小时,除此之外还涉及拆书和重装,还是交给专业人士比较方便。

真要买的话其实现在最普通的款式(比方说 epson 的 perfection 系列)只要几百块,清晰度一般最低都能达到 4800dpi ,京东上随便找个顺眼的销量高一点的绝对够用了。 A4 大小的书籍 4800dpi 扫出来每页有几十 GB 大,一般只有扫原画或者小幅照片之类才会用到 2400dpi 以上的参数。实际上 300~600dpi 已经足够在各种设备上阅读和打印了,要求低点清晰度还能再降一半。

文字识别扫描仪自带的就不黑了。。不如在电脑上自己装一个。
惊了,以为是我发的贴。。
数据量大了之后真的麻烦。。我也没找到什么好的解决方法,只仿照 libgen 做了一个去重数据库
2017-02-16 03:11:45 +08:00
回复了 vertigo 创建的主题 分享创造 [另类想法] 如何保证一条消息十几年后才能被读取
对于大多数摘要算法(除了少数特殊的映射),能找到无数个原文来产生这段摘要。楼上已经有好几个人说过了,不能准确地用摘要还原出原文:这并不是因为还有任何的技术难题(比如算法、算力等)没有克服,而是由摘要算法的数学本质决定的,因为在不可逆映射中失去了信息。也就是说,这个所谓的“不能”不是人类能力达不到的那种“不能”(比方说 po 主所说的目前比特币的挖矿难度),而是本质上不能(就像热力学定律那样)。参见信息论。

举个例子,我可以定义一个简单的摘要算法:将二进制流的所有位相加取 2 的模,这样的算法将每个有奇数个 1 的二进制文件映射为 1 ,有偶数个 1 的二进制文件映射为 0 。这完全符合一个摘要算法的定义,但仅仅从 0 或者 1 却很难确定输入的原文到底是什么。上面这个算法可以看作是常见的复杂的标准密码学摘要函数的简化版本,但是可以从中看出,对于大量信息,在经过摘要之后必定丢失大部分信息。

对于从摘要还原出来的信息,最好的情况是能够给出“一列”可能的原文,一般来说这些“原文”经过解码后,能够符合编码规范而且符合人类自然语言规律的那部分原文是极其稀疏的,这就是为什么虽然看上去从数学上来说不能确定原文,但有时候却能够从摘要中还原出原文。实际上是因为文字编码规范和自然语言规律作为外部的信息(即一个很强的约束条件)补充了摘要中失去的信息量。(比方说如果知道原文是 unicode 编码,而某个原文出现了 unicode 编码中暂时还未使用的码,那么这个原文肯定就是错误的,即含有冗余的编码起到了校验的作用。相比较,如果原文是采用 hoffman 编码或者其它的某种满射的编码,那么就无法用编码规范作为约束条件补充失去的信息了)

如果想要保存的信息能够还原出来,不应该依赖上面的那种运气好的情况。也就是说,要完全地保险,就不应该使用摘要函数,而应该使用加密。最简单的方法是用一个较弱的 aes 密钥和加密轮数,虽然很弱,但是在现阶段用超算也是需要几年才能爆破,而在将来则可以很低成本地解密。这样可以实现 po 主要求的多年后可以解密,但是势必要足够的空间来存储至少与原文信息量相等的信息,就很难存到 blockchain 了。

另外有一种使用摘要函数的同时保证信息一般能被还原出来的方法,就是使用一个具有很大的冗余校验(或者纠错码)的编码,冗余越大,信息被还原出来的可能性也就越大。当冗余很大的时候,信息被还原出来的概率就趋近 1 。(在冗余最大的情况下,把整个信息完全映成一个码,但这样做就失去了编码的意义,因为需要和原文一样大的空间存储编码规则。。)这种方法看似行不通,因为这样只是相当于压缩文件,但是如果存储的是一篇人类可读的文章,那么实际上存在一个在人类中广泛流传的具有很强的校验能力的编码:自然语言规则。这个编码因为所有人类都知道,所以一般不用特别地存储在什么地方。通过这个自然的编码,就可以实现很大程度上的压缩,也就可以放心地用摘要函数也不担心信息丢失。当然,还原出来的信息需要人类自己来校验,效率是比较低下的。
2017-02-12 21:42:10 +08:00
回复了 alexapollo 创建的主题 信息安全 现在黑产都开始遍历所有可能账户了吗
@wclebb 都被脱库这么多次了,这网站还能用吗。。。
其实这样做还有个更严重的问题,如果有人拿到你的明文密码的话依然可以很容易猜出你其它网站的密码。比如说他拿到了 Mypass+CSDN+123 ,那么很容易就能猜出你的 google 密码应该是 Mypass+Google+123 或者类似的东西。虽然能躲过脚本小子的批量撞库,但是如果有人专门想搞你的话还是很容易被干。
1 ... 23  24  25  26  27  28  29  30  31  32 ... 47  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2380 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 11:55 · PVG 19:55 · LAX 04:55 · JFK 07:55
Developed with CodeLauncher
♥ Do have faith in what you're doing.