V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
whusnoopy
V2EX  ›  Python

人人网的社交资产被出售了,要不要试下用 renrenBackup 备份一下数据?

  •  
  •   whusnoopy · 2018-11-15 07:36:24 +08:00 · 6362 次点击
    这是一个创建于 2208 天前的主题,其中的信息可能已经有所发展或是发生改变。

    人人和多牛已经官宣 http://www.donews.com/news/detail/1/3027483.html 人人公司的社交网络相关资产卖给多牛

    几个月前做了一个人人的备份工具 https://github.com/whusnoopy/renrenBackup,再给自己做一波广告

    实现的功能

    • 抓取当前登录用户的留言板、状态、相册、日志及对应点赞评论
    • 抓取当前登录用户可见的其他指定用户的上述信息
    • 导出打包,脱离 Python 环境可直接浏览

    欢迎使用和发 Issue 提 PR

    26 条回复    2018-11-18 20:07:07 +08:00
    Wicked
        1
    Wicked  
       2018-11-15 07:51:43 +08:00 via iPhone   ❤️ 1
    我觉得抹掉自己数据的功能会更受欢迎…
    whusnoopy
        2
    whusnoopy  
    OP
       2018-11-15 07:58:41 +08:00
    链接后空格没弄好,重发一下 https://github.com/whusnoopy/renrenBackup
    littleghosty
        3
    littleghosty  
       2018-11-15 08:06:02 +08:00 via iPhone
    怎么也没想到人人网会变成低俗直播平台
    wobushizhangsan
        4
    wobushizhangsan  
       2018-11-15 08:10:29 +08:00 via Android
    我只想快点删库。让别人在百度搜索名字的时候别跳出来我在人人的智障评论。
    wongskay
        5
    wongskay  
       2018-11-15 09:16:51 +08:00
    删除自己的账户了
    XuanFei990
        6
    XuanFei990  
       2018-11-15 10:29:16 +08:00
    毕业的第二年就申请注销了,后来发现都变直播平台了,,自己的东西基本都找不到在哪里了,没有必要备份了。。
    CRight
        7
    CRight  
       2018-11-15 10:33:22 +08:00 via iPhone
    @wobushizhangsan 很早就可以删除账号的,虽然实质上只是隐藏用户,可以恢复。但也算国内很早提供这个选项的了
    nutting
        8
    nutting  
       2018-11-15 10:40:50 +08:00 via Android
    人人网为什么不秉持初衷好好搞呢,自从搞了类似媒体公众号每天推广告我就没玩了。像豆瓣一样用户产生内容不好吗,每年那么多新生呢可惜啊
    misaka19000
        9
    misaka19000  
       2018-11-15 10:43:21 +08:00
    python2 用不了
    misaka19000
        10
    misaka19000  
       2018-11-15 11:04:42 +08:00
    很好用,非常赞👍
    yaswen
        11
    yaswen  
       2018-11-15 11:08:10 +08:00
    @nutting 确实是。一手好牌打得稀烂系列。
    Abon
        12
    Abon  
       2018-11-15 14:06:04 +08:00
    很好用,点赞
    fenglangjuxu
        13
    fenglangjuxu  
       2018-11-15 14:19:58 +08:00
    已经注销账户,人人网,完全沦为一个黄网了,看上去.
    baiyuxiong
        14
    baiyuxiong  
       2018-11-15 14:40:57 +08:00
    你这个应该自己搭一个服务出来,直接在线备份。
    duzhenlin
        15
    duzhenlin  
       2018-11-15 15:45:08 +08:00
    就现在的人人网 能卖这些钱真不少了
    helionzzz
        16
    helionzzz  
       2018-11-15 15:51:19 +08:00
    @nutting 路太窄 毕业之后基本也就跟这个说再见了 要么就发展成社交约炮平台
    siknet
        17
    siknet  
       2018-11-15 16:20:10 +08:00
    可惜了,在上面找过几个女朋友
    whusnoopy
        18
    whusnoopy  
    OP
       2018-11-15 16:49:47 +08:00
    @baiyuxiong 抓这个也是要服务器和带宽的,同一个 IP 抓出去太多了也会被封,工具自己用吧,如果有人打算用这个工具做服务,也欢迎用,注明用的东西出处就行了,开源就应该这么玩
    whuhacker
        19
    whuhacker  
       2018-11-15 17:31:13 +08:00
    手動給師兄點讚!

    正準備再發個 PR 抓取全部好友,然後抓著抓著很容易半路上掛掉……接著去解決中途某個圖掛掉后直接跳過繼續抓後面的內容……入坑了
    snw
        20
    snw  
       2018-11-15 18:15:53 +08:00
    刚想发条状态却发现还要绑定手机
    kokdemo
        21
    kokdemo  
       2018-11-15 18:16:48 +08:00
    用了,挺好的

    抓下来,发现自己果然是 0 赞 0 评论 0 分享的小透明……
    pere
        22
    pere  
       2018-11-15 18:22:44 +08:00
    @whuhacker 大佬哪级的
    stepfensl
        23
    stepfensl  
       2018-11-15 23:00:43 +08:00
    没了
    terrytw
        24
    terrytw  
       2018-11-16 11:03:32 +08:00
    多年前花了好多功夫才把自己的信息删光
    mingyun
        25
    mingyun  
       2018-11-17 21:16:44 +08:00
    py 编码问题真蛋疼
    python fetch.py [email protected] passwordAtRenren -s -g -a -b
    load cookies from ./.cookies.json
    check login, and get homepage for cookie
    login valid
    Traceback (most recent call last):
    File "fetch.py", line 129, in <module>
    fetched = fetch_user(fetch_uid, cmd_args)
    File "fetch.py", line 87, in fetch_user
    get_user(uid)
    File "/root/renrenBackup/crawl/utils.py", line 58, in get_user
    print(' get user {uid} {name} with {pic}'.format(uid=uid, name=name, pic=pic))
    UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
    whusnoopy
        26
    whusnoopy  
    OP
       2018-11-18 20:07:07 +08:00
    @mingyun 这个看看本地的编码环境是不是有问题,或者用 py3 大部分情况会好一些,我后面测试也是在 py3 下做的。回头我加个不输出 log 的开关,这样至少命令行下跑起来会好一点
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2726 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 07:35 · PVG 15:35 · LAX 23:35 · JFK 02:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.