V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
dibis
V2EX  ›  Python

[ 爬虫入门问题 ] --如何爬取 ztree 树上节点,异步全部展开导出

  •  
  •   dibis · 2018-12-06 20:18:59 +08:00 · 1984 次点击
    这是一个创建于 2185 天前的主题,其中的信息可能已经有所发展或是发生改变。

    http://www.treejs.cn/v3/demo/cn/core/simpleData.html

    目前只能理出简单爬已经展开的节点。模拟点击一层层加载怎么实现?

    ''''

    def get_html_src(url):
    driver = webdriver.Chrome("/Users/qk/Downloads/chromedriver")
    driver.get(url)
    parentElement = driver.find_element_by_id('treeDemo')
    elementList = parentElement.find_elements_by_tag_name("li")
    
    with open("tmp/ztree.csv", "a") as csvfile:               
        writer = csv.writer(csvfile)
    
        for e in elementList:
            writer.writerow([e.text])
            e.find_elements_by_tag_name
            print('',)
    
            print('节点名称:', e.text)
    
    csvfile.close()
    time.sleep(10)
    
    driver.close()
    
    if __name__ == "__main__":
    
    get_html_src('http://www.treejs.cn/v3/demo/cn/core/simpleData.html')
    

    ''''

    2 条回复    2018-12-06 22:26:39 +08:00
    dibis
        1
    dibis  
    OP
       2018-12-06 22:26:02 +08:00
    修改好了

    with open("tmp/ztree.csv", "a") as csvfile:
    writer = csv.writer(csvfile)
    for num,e in enumerate(elementList,start=1):
    writer.writerow([e.text])
    try:
    print(num)
    print(e.get_attribute('innerHTML'))
    e.find_element_by_class_name('center_close').click()
    time.sleep(2)
    #print(eparent)
    #eparent.click()
    except WebDriverException:
    print("Element is not clickable")


    print(e.text)
    dibis
        2
    dibis  
    OP
       2018-12-06 22:26:39 +08:00
    下面要改成递归方法和叫错
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2884 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 06:29 · PVG 14:29 · LAX 22:29 · JFK 01:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.