1
kindjeff 2016-07-30 11:04:50 +08:00 via iPhone 1
那就模拟 ajax 呗
|
2
bengol 2016-07-30 11:05:37 +08:00 via Android 1
加油,放弃
|
3
wenmingvs 2016-07-30 11:06:12 +08:00 via Android 1
留言看看网友有好的建议不
|
4
Lonely 2016-07-30 11:08:32 +08:00 via Android 1
有问题就问啊…
|
5
loading 2016-07-30 11:09:27 +08:00 via Android 1
说一声,直连数据库…
|
6
vtea OP |
7
phperstar 2016-07-30 11:20:46 +08:00 2
先下载别人的代码看看呀,然后再别人代码上再修改成自己要用的。 造轮子得先学会拆轮子,这样学习起来也比较快
|
8
xiaoshangmin 2016-07-30 11:29:17 +08:00 via iPhone 1
几天?我在学校自学 php 和 Python 什么问题都是自己搜索解决的 身边就没有一个喜欢打代码的 加过各种技术群 在论坛发过各种问题贴 从一个选错软件专业的人 花了快一年多 懂得 mvc 网页 翻墙 搭 lamp 爬虫 噢对 还会双击装系统 出来工作才发现我应该转行当厨师的 蛋炒饭 水煮方便面不加调料 现在都是我的拿手菜 不说了 要去送外卖了
|
9
6IbA2bj5ip3tK49j 2016-07-30 11:42:43 +08:00 1
为什么会有人觉得 ajax 不好抓, ajax 才是最好抓的,直接发请求就好了。
|
10
hellojinjie 2016-07-30 12:36:56 +08:00 via Android 1
写代码的时候,你需要旁边有能 google 的电脑。这样自学会很快
|
11
a412739861 2016-07-30 12:54:45 +08:00 1
用 chrome 的 web develop tool , windows 应该是 F12 ,能看出很多东西。也可以会记录请求。
|
12
terence4444 2016-07-30 12:59:51 +08:00 via iPhone 1
从简单的开始
|
13
markx 2016-07-30 13:02:50 +08:00 1
从简单的开始+1.
如果一开始有多都不懂的话,做起来确实会很没方向,也会遇到很多奇怪的问题。 |
14
icedx 2016-07-30 13:05:52 +08:00 1
看在你经常光顾午夜俱乐部的份上 有啥就问我吧
|
15
INW017bzMfgkkYGn 2016-07-30 13:08:28 +08:00 1
@xgfan 哈哈,那是你还没遇见难抓的,比如: http://www.tianyancha.com/s.json
|
16
Ahri 2016-07-30 13:23:08 +08:00 1
楼主需要先看懂 HTTP 协议。
|
17
yamyamyuo 2016-07-30 13:47:19 +08:00 2
最好的学习方法,看国外的 mooc ,先把国外的计算机基础课程都跟着学下来,并把项目都做了,你慢慢会有感觉,感觉楼主还没入门, google + stackoverflow oriented programming 几乎可以解决你遇到的任何问题,如果还有问题解决不了,那就去 stackoverflow 发帖子问咯
|
18
buckyRRRR 2016-07-30 13:54:48 +08:00 via iPhone 1
才几天而已,而且几天里又有多少时间是在真正在学编程, Python 好学,不过好学是相对的说法,编程本身并不简单呀,最起码过一个月再说吧
|
19
UnisandK 2016-07-30 14:01:05 +08:00 1
先用 postman 调通了再去写代码实现
|
20
DoraJDJ 2016-07-30 14:18:57 +08:00 via Android 1
@xgfan +1 ,只要上 F12 的 Network 标签里寻找 xhr ,然后照着请求弄一个就好了。
还可以把请求复制成 curl 命令方便研究。 |
21
ytmsdy 2016-07-30 14:27:15 +08:00 1
ajax 是最好抓的,请求简单,返回的数据又标准。
|
22
lxy 2016-07-30 14:40:07 +08:00 1
我一直觉得爬虫不是新手能够随便上手的东西,简单的静态页面就罢了,遇到稍微复杂点的就容易懵逼。爬虫需要了解一些前端和后端的基础知识,至少知道整个请求交互过程是怎样起作用的。
|
23
wizardforcel 2016-07-30 14:43:23 +08:00 1
fiddler 也可以发包的。先用 fiddler 调通了再写 python 吧。
|
24
gpw1987 2016-07-30 14:45:32 +08:00 1
不好着急呀,有些东西自学是比较枯燥的,所有好的教程还是很有必要的。
|
25
dreamcog 2016-07-30 16:10:10 +08:00 2
慢慢来~~~以前看过一篇文章,讲如何成为编程高手。大概的意思是说,千万不要相信 XXX 上面的《 15 天精通 XXXX 》,《 7 天成为 XXX 高手》,真正成为一名编程高手需要 10 年。
最初做项目的时候,我从来没有学过程序,只会做设计和一些 HTML ,后来就自己学 PHP,JS,PYTHON 。直到今天我也会发现每天都在进步,都学习到更多的知识。最重要的事情是找一个 TODO 把要做的事情写下来,然后去一个一个攻克它,最后发现进步的还是自己。 一定需要兴趣,慢慢来的决心。 |
26
vtea OP @loading 不知数据库密码。。
@phperstar 我也是这么想的,只是发现自己欠缺很多知识 @xiaoshangmin 大神。。。受我一拜 @xgfan 我改去学 ajax @hellojinjie 恩,是的,有很多前辈的经验 @a412739861 这个我知道,只是很多看不懂 @terence4444 是的,抓普通网页保存到 txt 会弄,现在想抓单位的 oa 却不行了 |
27
vtea OP |
28
cfans1993 2016-07-30 16:21:23 +08:00 1
@dreamcog 我看的版本和你不一样, 我看是 30 天精通 java, 第一周学习基本语法, 第二周 io, 第三周多线程, 第四周研究时光穿梭机, 第 30 天穿越回 10 年前且杀死自己, 然后重新开始学习... :D 纯属娱乐
|
29
a412739861 2016-07-30 17:03:57 +08:00 1
@vtea 补充一下楼上的 Postman 是 chrome 的一个插件。
我用的时候是,开 develop tool 看页面结构, 使用方法,可以看一部分这个,虽然我也没看全: https://github.com/CN-Chrome-DevTools/CN-Chrome-DevTools fiddler 抓包应该问题不大了。我还遇到过 js 加密的…… ajax 没遇见过,所以不是很了解。 我用的 requests+BeautifulSoup4 ,后者解析网页用的,不知道你这用不用的上。 |
30
icedx 2016-07-30 17:13:16 +08:00 via Android 1
956815 零 82
|
31
vtea OP @a412739861 恩,谢了
|
32
tairan2006 2016-07-30 17:32:40 +08:00 1
看到标题我还在猜,楼主是在自学 Haskell/Scalar 还是 Rust 呢…
结果竟然是 Python 爬虫,这个其实不难的,动态网页你可以用无界面浏览器,等它加载完了不就是静态网页了。。 |
33
seandor 2016-07-30 17:33:33 +08:00 1
我也有过这种经历,以前想爬别人一个博客,我发现右键可以查看源文件里面显示的阅读量的数字,但是我爬虫却抓不到,然后就在网上问别人,别人告诉我这是动态的数据,还说什么 JSON 之类的。那时我连 JSON 是啥都不知道, AJAX 也不知道是啥。后来就放弃了。
不过最近有了一些新的感悟。我那时搞不定那个数据抓取的问题是因为我面前有一道知识断层,除非我花时间耐心地将这些知识补齐,我是很难跨越过去的。自学就很容易遇到类似的问题。 |
34
vtea OP |
35
Stupitch 2016-07-30 20:24:50 +08:00 via Android 1
直接上爬虫,当然问题多多,而且没有方向,先把 Python 基础掌握好了吧,到时候就能懂自己到底要干啥了
|
36
zzzreg 2016-07-30 20:30:11 +08:00 1
asp 的页面可能爬起来没有那么简单。。之前想爬学校一个设备管理的内部网站,看了一下点击每个链接都是 post 一个表单,表单里一堆莫名其妙的数据, url 根本没有变化。。所以你要去哪个页面必须先到主页,再一步一步点过去,保存书签也是不行的。目测是拿 vs 拖出来的,这种网页还真不好爬。。
|
37
sola97 2016-07-31 02:00:09 +08:00 1
之前爬教务系统,写了好几天,抓了部分数据,最后还是拿着现成漏洞直连数据库了
|
38
eoo 2016-07-31 07:24:06 +08:00 via Android 1
首先你得会基本的 http 协议和 Python 爬虫所需要的模块。
|
39
scg16 2016-07-31 10:03:59 +08:00 1
我也想自学 python 呢,还没开始
求楼主指路 |
41
vtea OP |