V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
woniu127
V2EX  ›  Python

又写了一个域名爬虫

  •  
  •   woniu127 · 2017-01-04 17:08:20 +08:00 · 3936 次点击
    这是一个创建于 2881 天前的主题,其中的信息可能已经有所发展或是发生改变。
    爬取的是 2m3m 网站上的域名数据,比较容易爬取,下一步打算爬取抢米网的。另外还写了一个域名检索的程序,可以进行基本的检索,如全字母,全数字,限制长度,数字+字母,包含某个字符以及字符+英文单词,并且加入了查询域名是否已注册的程序。
    github:https://github.com/gaokaigithub/2m3m
    7 条回复    2017-01-05 18:17:32 +08:00
    Sanko
        1
    Sanko  
       2017-01-04 21:33:23 +08:00
    还以为我被盗号了
    woniu127
        2
    woniu127  
    OP
       2017-01-05 08:05:34 +08:00 via Android
    @Sanko 哈哈哈,这么巧
    hiboshi
        3
    hiboshi  
       2017-01-05 10:42:18 +08:00
    走的人家接口
    其实可以拿 whois 信息的
    woniu127
        4
    woniu127  
    OP
       2017-01-05 11:41:00 +08:00 via Android
    @hiboshi 嗯嗯,也写过直接用 whois 的,因为用万网的 api 简单,就直接用了
    Viking
        5
    Viking  
       2017-01-05 17:14:03 +08:00
    好像不错,研究研究
    jiuzhe
        6
    jiuzhe  
       2017-01-05 17:51:33 +08:00
    目的是啥啊? 我有写过一个小网站 miduobao.com ,删除域名在 http://www.miduobao.com/viewdomaindeletedates.php
    没理解兄台从 2m3m 抓啥内容,它自己也是从别的地方抓来的数据啊
    woniu127
        7
    woniu127  
    OP
       2017-01-05 18:17:32 +08:00
    @jiuzhe 抓数据主要用来自己分析,找自己想要的域名
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2340 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 16:07 · PVG 00:07 · LAX 08:07 · JFK 11:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.