首页   注册   登录
 explorer123 最近的时间轴更新

explorer123

V2EX 第 399091 号会员,加入于 2019-04-06 23:18:44 +08:00
explorer123 最近回复了
@xiri 谢谢,学习了。
@fuckshit 如果微信没啥限制人人都能下那我这个项目就没有必要存在了。
@fuckshit 你这个没法下载历史消息啊。另外你的源码在哪?找了一圈没找到。
@omph key 半小时失效,对于抓取文章列表时间足够了。
@qwjhb
@encro
Fiddler Anyproxy Mitmproxy 肯定都可以,但 Fiddler 可以按几下鼠标就搞定,不需要写代码,对新人最友好。
抓 Header 模拟发送请求的方式确实对老手更友好效率更高。对新手的话,我想先放他们能理解的代码,让他们能看懂每一行代码。
@joson1205 排版不会乱,跟原文一样,公众号文章的 css 多数是内联的。
微信公众号部分可以参考下我这个项目中的源代码 https://github.com/LeLe86/vWeChatCrawl
@yuanjunye 嗯嗯,我最初想法就是让稍学过 python 的朋友能照着说明上手,先把结果跑出来了,他会更有兴趣和耐心去看源代码,而不是用高大上的讲解让新人看了想跑,哈哈。
@lau52y 这个让用户自己考虑吧,不在我的主要考虑范围内。
我做这个项目的原则是:如果你想学习怎么用 python 去下载想要的数据,或者想简单操作之后下些资料自己学习,那我可以帮你,对这些人来说慢一点没关系,不必考虑换 IP 的事,加上了反而影响他们对主线技术的理解。
如果你想实现大规模很爽的甚至是肆无忌惮的下载,显然已经不是上面的 2 种范畴了,那自己去研究就好了。我最怕最怕的就是好不容易搞出一个很完备的方案却被一些不良分子直接拿这个去商用赚小白的钱,那我就成了给他人做嫁衣裳。
@lau52y 不能我都不好意思发出来
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2215 人在线   最高记录 5043   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.3 · 12ms · UTC 12:04 · PVG 20:04 · LAX 05:04 · JFK 08:04
♥ Do have faith in what you're doing.