V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
yiiouo
V2EX  ›  问与答

爬取自身账号登录的网站内容,有没有法律风险?

  •  
  •   yiiouo · 2021-10-13 10:21:55 +08:00 · 1693 次点击
    这是一个创建于 897 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近有个朋友给了个外包活,想让我爬取一些电商的订单信息,他的账号是商家的,有大量订单信息,所以想用爬虫获取自身账号的所有订单信息。

    目前只做了个 DEMO,没有对接后端接口上报数据。我负责用 chrome 插件,一页页解析订单页的 DOM 内容,配合另外一个人用 python 解决滑块验证(我也不知道为什么不一起用 python 处理,他那边给的方案就是这样)。

    我也问过他这这个问题,他的原话是“我们目前是在完成产品 MVP,找种子客户实验闭环流程需要;验证完产品,会使用开放平台账号获取”。

    我想请教下大家,这个我要继续做下去吗?会不会有法律风险...

    8 条回复    2021-10-13 14:26:36 +08:00
    weeiy
        1
    weeiy  
       2021-10-13 10:29:46 +08:00
    触及利益程度 = 法律风险程度
    dll30
        2
    dll30  
       2021-10-13 10:41:51 +08:00
    滑动验证就是验证是否为真人,你用 Python 伪装为人的操作,这就是风险操作了
    ch2
        3
    ch2  
       2021-10-13 10:42:12 +08:00
    想赚那么多钱,找个律师咨询一下不行吗
    cheng6563
        4
    cheng6563  
       2021-10-13 11:35:28 +08:00
    参考腾讯游戏账号玩家只有使用权,就算玩家想卖掉游戏币也是非法的。
    Vegetable
        5
    Vegetable  
       2021-10-13 11:40:28 +08:00
    理论上可能有,实际上应该没有,淘系的卖家辅助开始不都这玩意吗?

    平台火了->头部用户自己想办法满足需求->平台自己推出开放平台->服务商入驻转正
    catVSdog
        6
    catVSdog  
       2021-10-13 11:48:11 +08:00
    记忆中看到过一次关于网络爬取的案例,爬取自己的信息是没法律风险的,因为这些信息你本来就可以访问,爬取只不过是换了一种访问这些信息的方式。。
    gam2046
        7
    gam2046  
       2021-10-13 11:59:14 +08:00
    @catVSdog #6,按这样说的话,绝大多数爬取都是安全的,因为绝大多数爬取的数据并不是本身行为人无法访问,比如张三爬了淘宝上其他商家的销售量,这个数字本身也都是显示在网页上,所有人都可以查看。
    yiiouo
        8
    yiiouo  
    OP
       2021-10-13 14:26:36 +08:00
    @catVSdog 这商家的订单有买家的一些个人信息,那客户怎么用这些数据,我这边也不知道,感觉还是有风险吧?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1048 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 22:35 · PVG 06:35 · LAX 15:35 · JFK 18:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.