V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
tiRolin
V2EX  ›  Java

做爬学校课程表和成绩那种爬虫应用犯法吗?

  •  
  •   tiRolin · 248 天前 · 6764 次点击
    这是一个创建于 248 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我学长让我帮忙做这个爬虫,因为他想做这种应用,大概就是跟超级课程表差不多那样的,学生输入自己教务网的账号密码就可以看到自己的课程表和成绩等相关内容

    他让我做,然后给我一些报酬,我现在也是在校的,没事干我也想学点爬虫,所以我是挺想做的,而且我觉得这个的确也有市场,但是我不确定这个合法吗?因为我现在做一些学校的爬虫,很容易都能看到一些反爬的设计,我有点慌说实话

    也没做什么违法的事情,就做个爬虫,之后学生可以自己提供账号密码在应用上看到自己的课程表和成绩,大概这个样子

    当然具体有没有做违法的事我不知道,我只做了正经爬取的一部分的内容,服务器和内部细节也不归我管,这个活做着没问题吧?我就是担心做一半进去喝茶我,所以来问问

    81 条回复    2023-08-28 18:33:49 +08:00
    leo97
        1
    leo97  
       248 天前 via Android
    问老师
    moyupoi10
        2
    moyupoi10  
       248 天前
    本来不犯法,你说出来就犯法了
    1145148964
        3
    1145148964  
       248 天前   ❤️ 4
    学长,收钱。这两个关键词加上去必违法
    worldqiuzhi
        4
    worldqiuzhi  
       248 天前
    有风险 自己学校问题应该不大
    FloatingLeaves
        5
    FloatingLeaves  
       248 天前   ❤️ 1
    1. 不存储用户信息,包括账号密码、课程等一切数据
    2. 不盈利
    3. 最好打个申请,如果说你的项目其他业务比较丰富可以尝试下申报创新项目之类的东西,当然做到上面两点基本就不会有问题。
    zjuster
        6
    zjuster  
       248 天前
    “学生输入自己教务网的账号密码”

    违法的。

    https://www.v2ex.com/t/966969
    zjuster
        7
    zjuster  
       248 天前
    这种东西,唯一的洗白路径是学校内部,通过教务系统(大部分是计算机系自己做)接入,走校内项目来做,也可以给自己的简历加分。赚钱不要想。
    someday3
        8
    someday3  
       248 天前
    一般来说对学生做的东西即使有破坏也会从轻和从无发落。

    但是前提不能有经济利益!!!

    你都收钱了,真有什么破坏性产生了,想保你也保不住啊。

    建议不要做,钱肯定是小钱,风险会持续很久,没必要。
    rimutuyuan
        9
    rimutuyuan  
       248 天前
    大学做过课表,没人管。后面做了个自动评教,被教务处请喝茶了
    haneki
        10
    haneki  
       248 天前 via Android
    欲加之罪何患无辞。
    Lockeysama
        11
    Lockeysama  
       248 天前
    有个罪叫:破坏计算机系统罪

    它的达成条件简单的情况下,可能就是你爬的快一点,把人服务器爬崩了(类似达成 DDOS 的效果)
    pldxx
        12
    pldxx  
       248 天前
    别把自己学籍爬没了,收钱了性质就不同了。
    你这个学长是已经毕业了还是在校生?
    loopinfor
        13
    loopinfor  
       248 天前
    如果是只应用于自己学校,没啥风险,出了事也就谈个话最多记过处分下。如果应用于其他学校,风险比较大。
    账号密码保存了有从你们这里泄露的风险。另外就是其实教务系统绝大多数学校都是招标采购的,国内做教务系统的公司也就是只有那一堆。如果后续某些功能动了某些公司的奶酪,或者某些功能引起相关用户(指的是相关学校)投诉,就有风险。
    wyd011011daniel
        14
    wyd011011daniel  
       248 天前
    可以去参考一下 Wakeup 课程表 APP ,他们就是做了学生打开对应的网页自动获取课程信息。小米的 miui 课程表也类似。
    NessajCN
        15
    NessajCN  
       248 天前
    「学生输入自己账号密码看到自己课程表和成绩」
    如果只是给别人自己看自己的,你不收集他的数据,那不叫爬虫,最多算个界面增强
    不过你如果采集了数据保存下来那就是另外一码事了,这是典型的钓鱼网站窃取信息,银手镯伺候
    hhjswf
        16
    hhjswf  
       248 天前 via Android
    成绩这已经不是爬虫了吧,这是入侵服务器了
    daimiaopeng
        17
    daimiaopeng  
       248 天前
    提供教程让用户自己通过 F12 获取接口数据,然后导入你开发的 app
    scemsjyd
        18
    scemsjyd  
       248 天前
    我大学那会儿,有同学直接找学校开通一个接口,然后对接微信公众号给学生提供课程查询。你只要获得学样授权应该就没有问题。
    RiverMud
        19
    RiverMud  
       248 天前 via iPhone
    @Lockeysama 的确,网络时代的口袋罪,OP 说的这个行为反而会让破坏计算机系统罪看起来不那么口袋。
    tiRolin
        20
    tiRolin  
    OP
       248 天前
    @pldxx 我超,这么恐怖的吗
    我赶紧把钱退了,我都帮他做完一个爬虫了,但是这个爬虫没有保存数据的功能,起码我做的范围内是没有功能的,我赶紧把钱还给他跟他说我不干了,溜了溜了
    哥们以后还要赚大钱的呢,别特么钱没赚上橘子先进了就因小失大了
    jsq2627
        21
    jsq2627  
       248 天前 via iPhone
    记得十年前刚上大学,课程表市场就已经被超级课程表占领了。现在还是这样呀。
    mingmeng
        22
    mingmeng  
       248 天前
    最好搞个申请,现在高校对这些看的很重。自己玩玩可能还没事,如果要商用甚至非盈利纯个人兴趣开放使用,那么你很有可能触发破坏计算机信息系统罪....

    之前在学校做过相关的事情,这个应该找学校信息化办公室,或者网管中心类似的部门。可以咨询下试试
    vtwo
        23
    vtwo  
       248 天前
    你做一个浏览器插件,打开后台获取课表,同步到你自己的应用
    ThinkStu
        24
    ThinkStu  
       248 天前
    如果盈利就有可能有问题,学校是有权追究的。而且你写的时候也要注意不要导致程序爬的很频繁。
    ThinkStu
        25
    ThinkStu  
       248 天前
    另外十分重要的一点就是,你的服务器不能保存任何有关学生个人的信息,否则出事了,事情可就不小
    ThinkStu
        26
    ThinkStu  
       248 天前
    @ThinkStu #25 跟学校有过沟通,不能存数据这一条是底线
    iorilu
        27
    iorilu  
       248 天前
    肯定违法的
    Kiriya
        28
    Kiriya  
       248 天前
    说白了一个选课都会卡的系统你还敢上爬虫?服务器崩了问题就大了
    opengps
        29
    opengps  
       248 天前
    简易的判断办法:先看下是否有验证码,带验证码本身就是拒绝爬虫的态度了
    kerb15
        30
    kerb15  
       248 天前
    @wyd011011daniel 学生打开对应的网页,不是也要让他们输入账号密码吗
    liujigang
        31
    liujigang  
       248 天前   ❤️ 6
    你明明是手抄的,你却说是爬的
    twofox
        32
    twofox  
       248 天前 via Android
    我一个月前还在做教务系统。你这个功能,我有好几个客户投诉过。有好几个公众号爬了我们的系统数据

    放心,我们会有专门律师去起诉的
    twofox
        33
    twofox  
       248 天前 via Android
    @Kiriya 选课是一个很复杂的业务,加上技术稀烂,服务器比图吧垃圾佬攒出来的双路 E5 好不了多少,自然就会崩
    abcbuzhiming
        34
    abcbuzhiming  
       248 天前
    @tiRolin 这里面的关键有两点:

    1.你别把服务器爬崩了,高校的服务器,是典型的平时没屁事,一旦关键时候有事,就是超级大事。我知道的一个傻 x ,黑别人高校的服务器为乐(高校的很多服务器都是漏洞百出,随便进的),平时别人也懒得管,终于有一天,这个傻 x 在该高校 4 ,6 级考试的时候把播音台的系统给搞崩了,造成考试终止,于是,重大安全事故,学校出信函盖公章,省公安厅挂牌督办,1 天之内就把这个傻 x 抓了出来,结果这个傻 x 自己也是个大学生,自带对法律免伤 buf ,最后只是记大过。

    2.你爬到的数据不能外部使用,因为学校没有授权,明白吗?授权的数据还需要你爬吗?你直接拿 U 盘去拷不更快,绝大部分爬虫都是死在这个问题上,没授权的数据哪怕公开的,你拿着外部用了,不管盈利与否,数据所有者都有权追究。
    一旦追究了,一告一个准
    Mystery0
        35
    Mystery0  
       248 天前 via Android
    看学校的态度,然后就是不能收钱
    因为我自己就做了一个一样的东西,现在毕业了,app 在学生中口碑很好,教务处老师不喜欢
    我们也只做查询类的功能(只读不写),什么选课、自动评价的,想都不要想,跟着学校的态度来,最好还是挂靠到学校的实验室或者部门下面,有老师的关系,能够好说话很多,出事也能及时知道
    dji38838c
        36
    dji38838c  
       248 天前
    你在这里发帖,用了翻墙工具
    已经犯法了
    HankLu
        37
    HankLu  
       248 天前
    灰色产业,不合法,也不犯法
    mkoijnbhu
        38
    mkoijnbhu  
       248 天前
    看看小米小爱同学课程表的设计:

    提供一个 Webview 自己在上面登录账号点击到课程表页面, 然后通过各个学校同学贡献的代码获取内容

    我觉得你这个爬虫占不了多大资源, 让学生提供账号密码就不行
    wusheng0
        39
    wusheng0  
       248 天前 via Android
    喜鹊儿
    MAKF
        40
    MAKF  
       248 天前
    连这点胆识都没有,还得跑到这来问。还是乖乖毕业打工吧,别想那么多了。
    tiamoluciye
        41
    tiamoluciye  
       248 天前
    要弄你就偷偷弄,请做好匿名,防护,不要被抓 ip ,比如找同学买一个校园网账户,然后去图书馆人多的地方什么的。
    bnull
        42
    bnull  
       248 天前
    这玩意有前车之鉴的,不收钱都被叫去喝茶过,你真要搞和学校报备好,一定要有老师同意申请。我们学校就是社团申请了权限然后做成小程序的。
    datou
        43
    datou  
       248 天前
    护网行动结束之前千万别弄
    zuotun
        44
    zuotun  
       248 天前
    当然违法, 以前我自己学校比我大一届的学长就做过, 后面学校出面了.
    不过可能也是因为这个, 后面学校也自己弄了一个 App, 教务系统做的也还算可以(一部分, 财务依然是十几年前的风格....
    zjou
        45
    zjou  
       248 天前 via Android
    有兴趣可以加我 qq 一下,我自己开发了我们学校的教务小程序,运行半年了没问题。很多大学都有学生自主开发的教务程序,不涉及科技抢课这种就没事。
    lidongyooo
        46
    lidongyooo  
       248 天前
    弄就完事了,匿名 IP 做好。再不济发现了就说不知道是犯罪,谅你是本校学生最多给个处分就完事了。
    tramm
        47
    tramm  
       248 天前
    频率别那么高就没事
    Rooger
        48
    Rooger  
       248 天前
    注意安全,有好多东西可能不太容易说的清楚,特别是你已经收钱了的。

    例如:我没有保存密码到数据库,但是不小心打印到日志里面了,这个如果被相关部分查到,应该也是违法的。
    MrSheng
        49
    MrSheng  
       248 天前
    @haneki #10

    别人不懂就你懂?真讨厌
    coolfan
        50
    coolfan  
       248 天前
    小米的小爱同学有个小爱课程表,会要求你自己登陆到课程表的页面,然后在本地解析出课程信息导入到 app 。
    解析的逻辑是有个开发者群,看起来好像都是学生自己提供的。
    murenx
        51
    murenx  
       248 天前
    1.盈利性质,校外交易,风险不可控
    2.数据获取方式,非授权,爬挂系统
    3.数据管理,泄露密码成绩等等
    总结:百害无一利 ps:爬虫做的好,牢饭管到饱
    Kenyore
        52
    Kenyore  
       248 天前
    任何非公开发布的数据 都是不 ok 的
    brust
        53
    brust  
       248 天前
    违法
    makejohn2015
        54
    makejohn2015  
       248 天前
    爬数据违法, 你要是不存数据,每次登录都重新获取课程信息,相当于再爬一遍, 人多了, 系统都被你爬崩了, 你要是存数据了, 那更是妥妥的违法
    gps949
        55
    gps949  
       248 天前
    “学生输入自己教务网的账号密码”。。。
    这叫爬虫???这应该叫浏览器套壳或者干脆叫开发浏览器吧?
    chesha1
        56
    chesha1  
       248 天前
    自己用不犯法,再分发给别人用犯法,你还收钱,这是在法律的边缘疯狂试探啊
    banliyaya
        57
    banliyaya  
       248 天前
    我记得我之前读书都是用的超级课程表这个 app ,课程有改动这个 app 也能及时更新 是怎么做到的。
    wyd011011daniel
        58
    wyd011011daniel  
       248 天前
    @kerb15 只是打开一个浏览器窗口,学生登录后获取网页里的课表信息,类似你做了个浏览器,用户在网页里输入密码你也不需要负责吧。
    woshipanghu
        59
    woshipanghu  
       248 天前
    都是爬虫犯法 这些数据公司早就被取缔了
    爬数据不要影响别人系统的稳定性 别人睁一眼闭一眼
    zhch602
        60
    zhch602  
       248 天前
    @gps949 ???这不叫爬虫什么叫爬虫,难道爬虫就不需要鉴权就能看别人的数据了?
    nothingistrue
        61
    nothingistrue  
       248 天前
    —— 就做个「爬虫」,之后学生可以「自己提供账号密码在应用上看到自己的」课程表和成绩

    如果真是后者那样的场景,那么只能是实时分析网页,用不上爬虫。现在用了爬虫,那真实场景就不是后者了,八成这连用户名、密码都想办法保存了。你现在再想象这不犯法的机率有多少。
    mooyo
        62
    mooyo  
       248 天前
    犯法的,这个会进去。
    clf
        63
    clf  
       248 天前
    违法的。正规的项目应该是和校内信息中心直接申请相关数据,然后同步到自己系统上。并对接学校统一身份认证实现学生登录。
    gps949
        64
    gps949  
       248 天前
    @zhch602
    ???那照这样说,Chrome 、Edge 、Safari 都叫爬虫工具对喽?
    Mandelo
        65
    Mandelo  
       248 天前
    别因为这种蝇头小利搞上个污点,只要你盈利性质就变了
    sadfQED2
        66
    sadfQED2  
       248 天前 via Android
    你直接去教务处说下吧,我大学的时候做过,教务处直接把数据库给我了。当时我不仅做了课表,还做了成绩查询,当时我们学校是从正方买的系统,用的 oracle 数据量,数据库没加任何索引,但是有一大堆拼表逻辑。以前每年选课,查成绩必崩。

    我做的成绩查询加了 redis 缓存,然后给教务数据量加了几个索引,以前每年查成绩都崩,从那之后查成绩功能再也没崩过了。

    最后我毕业的时候教务的老师还想我留校去教务处工作。
    sadfQED2
        67
    sadfQED2  
       248 天前 via Android
    你直接说我可以帮忙优化系统,学校找正方这些公司优化是要钱的,教务处的人巴不得你免费去帮忙搞搞。只要你跟老师关系好,老师信任你的能力,直接就给你权限了
    muchun
        68
    muchun  
       248 天前
    @sadfQED2 #67 不会的,直接给权限如果出事了谁背锅。
    sevenyangcc
        69
    sevenyangcc  
       248 天前
    爬,就违法,不过看学校觉得事大不大。有没想过,转变一下思路,找学校问能不能开个接口
    xuAN111
        70
    xuAN111  
       248 天前
    我两年做过,现在依然在运营(日活 1w+)。

    被喝过茶,没有多大问题,只要不是非法黑入或者存储学生数据就行。

    被喝茶之后,我课表第一次使用都会有个用户协议和隐私政策,再加上一条教务系统课表查询系统授权同意弹窗就 ok
    xuAN111
        71
    xuAN111  
       248 天前
    可能是我做的那几个学校信息中心觉得没有问题,那时我也有听说其他学校一个做课表的学生被抓到派出所。
    CTd1DJnr6KlM
        72
    CTd1DJnr6KlM  
       248 天前
    我是不理解这个问题为什么楼上一堆人从技术上去理解
    有没有人喝茶,有
    有没有人没喝茶,有
    裁量是不是听学校,是
    喝不喝茶是不是一个纯技术问题,不是
    做之前跟学校沟通一下是不是更好,是
    被请喝茶了是不是依旧要和学校沟通,是

    如果不愿意和学校沟通,那就六个字
    做别怂,怂别做
    Ericcccccccc
        73
    Ericcccccccc  
       248 天前
    学校报警你就违法.
    orange14
        74
    orange14  
       247 天前
    大作业做过,几个教务系统的接口,不过就自己在用
    kerb15
        75
    kerb15  
       247 天前
    @wyd011011daniel 不知道啊,我是这么认为,但是上面他们都说这是帮信罪啊
    love51money
        76
    love51money  
       247 天前
    1 、爬虫不能涉及个人隐私,信息属于公民个人信息的,涉嫌“侵犯公民个人信息罪”
    2 、爬虫程序规避经营者设置的反爬虫措施或者破解服务器防抓取措施,涉嫌“非法获取计算机信息系统数据罪”
    3 、爬虫干扰网站或系统正常运营,涉嫌“破坏计算机信息系统罪”
    4 、明知他人从事违法犯罪活动的,提供技术支持,涉嫌“帮助信息网络犯罪活动罪”,俗称帮信罪,注意,这里所谓的“明知”包含你是否怀疑过对方是否不正常


    综上所述,你要确认一下几个问题:
    1 、学长是否是正常人,学长做什么的?如果疑似有问题,立马拒绝
    2 、你爬教务网自己账户密码里面的内容,要看教务网是否说明不准通过其他手段获取信息,如果学校系统做了反爬,请不要去爬了
    3 、很多人因为技术无罪,认为没有做什么违法的事情,但是你要明白坏人利用技术会去干什么?会对社会产生什么影响?灰产黑产的思路不是随便可以明白的
    4 、看你的提问,其实疑问点很多,疑问越多,可疑性就越大,建议不要去做
    FarmerChillax
        77
    FarmerChillax  
       247 天前
    7gugu
        78
    7gugu  
       247 天前
    犯法的,理论上只要学校上纲上线就一打一个中
    treblex
        79
    treblex  
       247 天前 via iPhone
    什么爬虫,我这只是经过优化用户体验重新设计的第三方客户端而已( ̄∇ ̄)
    zhch602
        80
    zhch602  
       247 天前 via iPhone
    @gps949 谁跟你说浏览器叫爬虫了?浏览器能自动化采集存储数据么?
    spannerc
        81
    spannerc  
       242 天前
    我觉得有几个点是高危行为:

    1. 爬虫影响教务系统正常运行
    2. 盈利
    3. 用户数据泄露

    建议搜一下相关判例再评估风险。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3028 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 08:15 · PVG 16:15 · LAX 01:15 · JFK 04:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.