V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
ihancheng
V2EX  ›  Python

求推荐 Python 和爬虫的书籍?

  •  
  •   ihancheng · 2018-06-24 01:35:19 +08:00 via Android · 6335 次点击
    这是一个创建于 2371 天前的主题,其中的信息可能已经有所发展或是发生改变。

    饿… 那啥… 大晚上的好饿啊…

    发个水贴,大家来分享 /推荐一些 python、爬虫类的数据可好?要是附上自己的推荐理由就更完美了!

    第 1 条附言  ·  2018-06-24 10:30:03 +08:00

    最好能附上推荐理由!谢谢!

    13 条回复    2018-06-26 23:40:46 +08:00
    ihancheng
        1
    ihancheng  
    OP
       2018-06-24 01:36:32 +08:00 via Android
    更正:爬虫类的书籍……
    OpenJerry
        2
    OpenJerry  
       2018-06-24 01:43:45 +08:00 via Android   ❤️ 2
    O'Reilly 的动物书《 Python 网络数据采集》,封面是一只穿山甲
    1yndonn3u
        3
    1yndonn3u  
       2018-06-24 08:22:52 +08:00
    congeec
        4
    congeec  
       2018-06-24 11:24:18 +08:00 via iPhone
    爬虫书极少,市面上销量最高的不要看。不咋地

    scrapinghub.com 有个员工出的书我看不错
    https://github.com/scrapinghub/scrapy-training/blob/master/README.md 他家的练习题不错
    whoami9894
        5
    whoami9894  
       2018-06-24 14:55:38 +08:00 via Android
    @OpenJerry
    我看过这本,讲的不错。不过
    让我印象深刻的是,这本 15 年印刷的书在最后的 14.5 节有这样一句话:
    > 本书未来的版本可能会完全忽略 JavaScript,它已是一种过时的,极少用的技术了,而重点关注用 HTML8 实现页面
    ihancheng
        6
    ihancheng  
    OP
       2018-06-24 15:20:53 +08:00 via Android
    @whoami9894 HTML8 ?🤣
    gitopen
        7
    gitopen  
       2018-06-24 16:47:46 +08:00 via Android
    没看书,都是自己琢磨着写,有啥需求就去爬啥,然后学
    locoz
        8
    locoz  
       2018-06-24 17:32:41 +08:00
    @whoami9894 HTML8 ?
    whoami9894
        9
    whoami9894  
       2018-06-24 17:53:44 +08:00 via Android
    @ihancheng
    @locoz
    书上原话,一字不差[doge]
    jadeity
        10
    jadeity  
       2018-06-24 20:25:45 +08:00
    https://germey.gitbooks.io/python3webspider/content/

    实体没买,只看了前边免费的。感觉大体思路是有了,再就是细节的东西了。
    chengxiao
        11
    chengxiao  
       2018-06-24 23:08:46 +08:00
    哎 感觉现在玩爬虫 玩到后面都是逆向.....各种找接口参数生成
    ihancheng
        12
    ihancheng  
    OP
       2018-06-24 23:14:41 +08:00 via Android
    @chengxiao 深坑吗?
    ihancheng
        13
    ihancheng  
    OP
       2018-06-26 23:40:46 +08:00 via Android
    此贴收藏人数>回复人数😥😥
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1308 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 23:47 · PVG 07:47 · LAX 15:47 · JFK 18:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.