V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ace12
V2EX  ›  问与答

领导让我爬全量工商数据,我该怎么办

  •  
  •   ace12 · 2020-04-02 10:48:21 +08:00 · 6038 次点击
    这是一个创建于 1688 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我自闭了,让我一个人搞

    32 条回复    2020-09-16 10:57:47 +08:00
    AngryPanda
        1
    AngryPanda  
       2020-04-02 10:48:58 +08:00
    这是劝退的新姿势
    jdgui
        2
    jdgui  
       2020-04-02 10:49:08 +08:00
    别爬,辞职跑路。
    这是得坐牢的
    YoRolling
        3
    YoRolling  
       2020-04-02 10:52:07 +08:00
    律师找好了吗?
    bitdepth
        4
    bitdepth  
       2020-04-02 10:52:25 +08:00 via iPad
    消極應對,錄音告知法律風險要求豁免保證
    queuey
        5
    queuey  
       2020-04-02 10:53:45 +08:00
    录音举报公司,够他吃一壶的
    arthas2234
        6
    arthas2234  
       2020-04-02 10:54:45 +08:00
    保留证据,就是让你爬取工商信息的证据,文字版,有录音最好
    然后明确拒绝,并告知这是违法的事
    不要辞职,等公司辞退你,然后把证据拍领导脸上
    whywhywhy
        7
    whywhywhy  
       2020-04-02 10:57:23 +08:00
    天眼查说过,采的是那些公开的数据,不违法。。。
    ace12
        8
    ace12  
    OP
       2020-04-02 11:00:32 +08:00 via Android
    擦,我才来,试用期都还没过,这年头真就这么难混么
    ace12
        9
    ace12  
    OP
       2020-04-02 11:01:49 +08:00 via Android
    @whywhywhy 问题是就算合法,这些网站反爬也挺猛的啊
    AlghaPorthos
        10
    AlghaPorthos  
       2020-04-02 11:19:22 +08:00
    如果不是敏感数据,间隔短一点,半夜爬一爬问题不大。但是要和领导说,要做好被永久 403 的准备。
    如果是敏感数据,带上录音笔(或手机开录音),去找领导说明,然后辞职报警。(这属于教唆指示了吧?)
    AlghaPorthos
        11
    AlghaPorthos  
       2020-04-02 11:19:43 +08:00
    @AlghaPorthos 写错了,间隔长一点。
    freeup
        12
    freeup  
       2020-04-02 11:24:45 +08:00
    直接天眼查开个会员吧
    CEBBCAT
        13
    CEBBCAT  
       2020-04-02 13:14:42 +08:00 via Android
    奇思妙想一下,gov 是不是应该主动公开信息呢?
    heiheidewo
        14
    heiheidewo  
       2020-04-02 13:17:49 +08:00
    如果对方做了反爬,那么你爬了就是违法,如果没有做反爬,并且是公开信息,那是可以爬的
    coderluan
        15
    coderluan  
       2020-04-02 13:28:03 +08:00   ❤️ 1
    有办法的,简单来说就是别用爬虫,用油猴脚本。

    这样一方面不会触发任何反扒措施,服务器顶多认为你在不停的打开网页。另一方面,打开只会的网页都是本地的了,你只是分析了自己电脑上的页面而已。唯一缺点就是这么做效率太低。
    Bantes
        16
    Bantes  
       2020-04-02 13:37:44 +08:00
    工商信息本身就是 ZF 公开数据吧,只要不把人家爬挂了应该没问题的
    azoon
        17
    azoon  
       2020-04-02 16:00:04 +08:00
    这事我老板也叫我干过,直接天眼查开个会员吧,就 360 块。
    jason0713
        18
    jason0713  
       2020-04-02 17:17:18 +08:00
    @azoon 老哥 请问开会员能拿到全量的数据 离线到本地吗 还是说只是可以查?
    azoon
        19
    azoon  
       2020-04-02 17:21:34 +08:00
    @jason0713 只能导出搜索结果前 5000 条记录,Excel 表,该有的项目都有了。
    jswh
        20
    jswh  
       2020-04-02 17:27:09 +08:00
    违法的
    hyshuang2006
        21
    hyshuang2006  
       2020-04-02 17:33:37 +08:00
    @whywhywhy 违法的人会说自己干违.法的事情吗?企业法人在工商注册时提供的私人号码,居然被天.眼.查给公开了,导致一系列广.告骚扰。这号码之前从未在网上发布过,这数据怎么会被泄露出去呢?
    fwn
        22
    fwn  
       2020-04-02 17:34:10 +08:00
    淘宝买个天眼查会员,几块钱
    dallaslu
        23
    dallaslu  
       2020-04-02 18:28:40 +08:00
    @hyshuang2006 年报泄漏的吧?
    whywhywhy
        24
    whywhywhy  
       2020-04-02 19:03:05 +08:00
    @hyshuang2006 本来就是公开的,才能被爬取到,所以是天~眼查方便了大家,所以你的信息才会被查到,这个嘛大概就是得与失吧。。。。。

    网站备案也是一样,本来登记就好了,偏偏还把真实姓名公布,所办的其他网站也公布,这就很不开心了。。。
    jugelizi
        25
    jugelizi  
       2020-04-02 19:09:53 +08:00 via iPhone
    你可以卧底去 把数据拷贝回来
    s127
        26
    s127  
       2020-04-02 19:34:00 +08:00
    数据确实是公开的,但是不代表你可以爬。如果爬虫访问量过大,造成网站访问异常,那就是网络攻击。如果网站有反爬虫措施,那基本上就靠你背锅了。
    hyshuang2006
        27
    hyshuang2006  
       2020-04-02 20:15:41 +08:00
    @dallaslu @whywhywhy 企业注册完第二年才要交年报的。可以肯定的是企业注册完没多久,就被天.眼.查将企业信息公开了,连留在工商局的私人联系电话都公开。

    更可恶的是,如果你有过诉讼,判决书是公开的,在天.眼.查里和你联系在一起。当事人的案件信息可以在法院网站查询,公开的,没问题,但天.眼.查那这些公开的信息贩卖,你付了钱才可以看,合法?

    知乎上有关于天.眼.查的讨论,一刑.侦.人.员这么评论:方便查.案,这网站在打法律查边球。
    Samuel021
        28
    Samuel021  
       2020-04-03 09:25:05 +08:00
    你可以试试说服老板买全量啊 doge
    whywhywhy
        29
    whywhywhy  
       2020-04-03 11:22:26 +08:00
    @hyshuang2006 不合法就找法院搞他!
    Codewj
        30
    Codewj  
       2020-04-03 11:28:40 +08:00
    我爬了,给公安用的
    hyshuang2006
        31
    hyshuang2006  
       2020-04-03 17:29:44 +08:00
    @whywhywhy 这种事情本来就该管,当.局不管,我等小市.民又何来能力搅动其?

    人家就声称这是公开的数据,一旦偶尔来的搞黑的,把人黑了一把,又使用“公开”的数据帅锅。是不是想逼人花钱删数据?这事情就如删网帖一样,银子滚着来。
    zhaochenge
        32
    zhaochenge  
       2020-09-16 10:57:47 +08:00
    需要全 DATA 找,[email protected]
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5520 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 08:51 · PVG 16:51 · LAX 00:51 · JFK 03:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.