1
zealic 2015-03-13 09:03:00 +08:00 2
那就不叫爬了,叫模拟浏览:
参考 Casper.js 以及 PhantomJS |
2
arachide 2015-03-13 09:30:34 +08:00 1
精确掌握这个技术的目前貌似只有google
|
3
icedx 2015-03-13 09:39:23 +08:00 via Android 1
PyQt 内置浏览器模拟浏览
|
5
saihuang 2015-03-13 10:02:24 +08:00 1
看一下selenium和phantomjs
|
6
nomaka 2015-03-13 10:03:53 +08:00 2
selenium
|
7
shoumu 2015-03-13 10:05:10 +08:00 1
PhantomJs
|
8
dingyaguang117 2015-03-13 12:10:13 +08:00 1
PhantomJs +1
|
13
poke707 2015-03-13 17:24:38 +08:00 1
如果你的目的是挖出js里面调用的ajax, 可以直接用chrome调试模式找出来URL来
|
14
leonlu 2015-03-13 17:31:46 +08:00 1
python爬虫可以删掉,用phathomjs重新写一份了。
|
17
kchum 2015-03-14 01:28:26 +08:00
PhantomJs 一劳永逸。再混淆你又要看一次。
|
18
gaotongfei 2015-03-14 10:45:41 +08:00 1
我都是用selenium-webdriver的
|
19
gaotongfei 2015-03-14 10:47:49 +08:00
|
20
tonic 2015-03-14 15:58:30 +08:00
可以试试 PyExecJS
|
24
hadesqiao 2015-03-16 15:18:23 +08:00
mark01
|
25
vincent123456 2015-07-29 22:28:45 +08:00
@icedx 话不能这么说,有些变态网站JS写的复杂的狠,例如QQ的
|