V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ATiGr
V2EX  ›  问与答

学爬虫技术应该如何开始?

  •  
  •   ATiGr · 2015-02-01 23:46:05 +08:00 · 4653 次点击
    这是一个创建于 3370 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有感于爬虫技术的威力 (/t/164359) 我深深地觉得,这是个强有力的工具!所以特别想拥有这样的Super Power。哪怕学习需要的时间久一点,要看很多书也没关系。

    我非计算机专业,有的只是十足的兴趣,和一些系统使用方面的知识,对 Linux ,仅仅懂得一些最最基本的命令行操作,但是也没怎么用过。所以,可能需要各位前辈从基础方向开始指导一个方向。需要补的框架知识是什么,最好有一个针对性的书目推荐啥的~

    如能得到前辈们的一些指导,定能少绕很多弯路,在此先行谢过!

    9 条回复    2015-02-02 14:02:56 +08:00
    Eymard
        1
    Eymard  
       2015-02-01 23:52:36 +08:00
    head first系列 随便看看先有个概念
    muziyue
        4
    muziyue  
       2015-02-02 06:00:53 +08:00
    html+http协议+python 这个应该最简单了
    justjavac
        5
    justjavac  
       2015-02-02 08:30:40 +08:00
    mhycy
        6
    mhycy  
       2015-02-02 08:57:51 +08:00
    把python的第三方包 requests 学会就算入门了
    phoeagon
        7
    phoeagon  
       2015-02-02 09:17:36 +08:00
    从认识到不要自己写爬虫开始。
    em70
        8
    em70  
       2015-02-02 14:01:13 +08:00 via Android
    先写个最简单的,然后不断完善,抓豆瓣吧
    wizardforcel
        9
    wizardforcel  
       2015-02-02 14:02:56 +08:00
    你先看curl和regex就好。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5977 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 02:07 · PVG 10:07 · LAX 19:07 · JFK 22:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.