针对的是本站某个帖子:
首先是一个用 Python 登录各网站的项目: https://www.v2ex.com/t/541855
可以看出都是从网上找来的代码,而且很多都是未经过验证就放上去了,没想到这个还能有 5k star ??
然后是作者所谓的教程: https://www.v2ex.com/t/550157 看一下所谓的教程: https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E7%88%AC%E8%99%AB%E9%A2%84%E5%A4%87%E7%9F%A5%E8%AF%86.md 随便搜索一句话:
随便进一篇文章: http://www.zhongruitech.com/692280656.html
左边是 github 的文章,右边是搜到的文章
请问这样一个完全靠“抄”的项目和教程真的很好吗?
1
chen2016 2019-03-30 19:10:22 +08:00
小白居多
|
2
Abbeyok OP opps.....帖子莫名下沉
|
3
sheeta 2019-03-30 19:46:20 +08:00
🆙顶一下
|
4
gazce 2019-03-30 19:46:46 +08:00 via iPhone
吃瓜路过
|
6
whoami9894 2019-03-30 19:47:34 +08:00 via Android 3
说出我的心声
|
7
zhang1215 2019-03-30 19:47:52 +08:00
因为大多数人都没耐心像楼主这样去验证,直接就点 Star 了
|
8
a1en 2019-03-30 19:49:55 +08:00 via iPhone
又不是不能 unstar
|
10
Abbeyok OP @whoami9894 我是完全没搞懂 他之前的 github 好像也是抄的。。
|
11
loading 2019-03-30 20:00:40 +08:00
临摹是第一步,如果他没法超越原作者,后面去看的人迟早会发现真正的大佬。
md 程序员已经很多了,CtrlCV 并不奇怪。 |
13
loading 2019-03-30 20:09:49 +08:00
|
16
CriseLYJ 2019-03-30 20:12:48 +08:00
这些专业性的知识,还有图难道要手写吗??别酸了兄弟。。我想请问,下面哪个你搜到的不一样啊??还没写到项目,等写到项目再说抄不抄好不??不喜欢上面有 unstar 呀? http 的知识难道要我一点一点说嘛?打扰了
|
17
CriseLYJ 2019-03-30 20:14:42 +08:00
对于一些定义性的东西,你能说怎么定义就怎么定义的??
|
20
CriseLYJ 2019-03-30 20:16:39 +08:00
请开始你的表演兄弟
|
21
gabon 2019-03-30 20:16:57 +08:00 via Android
说的好像只要 star 就会认真看似的😁
|
22
mscststs 2019-03-30 20:41:59 +08:00 15
看了一下原仓库,Python 爬虫那个贴子确实说了是 “收集”的。
然后又看了一下作者 5k star 庆祝,说更教程的那个贴子 emmmmmmm 不评论吧,但是结合一下这个贴子的内容和证据,总觉得 教程 repo 里 README.md 下面那行 : “转载请注明来源” 有点刺眼。 |
23
loading 2019-03-30 20:42:47 +08:00 via Android
本来我还觉得那个 repo 挺好的,没想到我提和 issues 张口就喷。
|
24
terence4444 2019-03-30 20:46:30 +08:00 via iPhone
抄了就是抄了,引用至少要注明来源,不能说抄了教程就可以光明正大了。
而且别人发现了立刻原型毕露,吃相一览无遗。 |
25
tumbzzc 2019-03-30 20:50:49 +08:00 via Android
@terence4444 是的,他的文章基本都是 ctrl c、ctrl v 拼接来的
|
26
orangeade 2019-03-30 20:55:24 +08:00 via Android
MD 项目 Star 那么多有什么用,真以为能糊弄到多少面试官么
|
27
CriseLYJ 2019-03-30 20:56:49 +08:00
66666666666666,都是大佬,小弟错了,对不起,HTTP 知识你们看百度百科行吧!的省有一些人说抄 https://baike.baidu.com/item/http 我只是个弟弟,满意?大佬们?
|
28
xiangyuecn 2019-03-30 20:57:02 +08:00
kelseyhightower/nocode
996icu/996.ICU star 高,并不一定代表内容有多好,事实如此呀 另外赞同楼主 #12 的说法。另:要是能虚心点标明出处,这才是皆大欢喜。 比如:csdn 上大量 copy 性质的文章,copy 就算了,还把人家的格式丢掉了,要是这种文章强制要求标明出处,就算没了格式很丑,但这种 csdn 还是极好的。对,就是要提 csdn。 |
30
CriseLYJ 2019-03-30 21:01:04 +08:00
如果有什么问题,可以 @我,我解答你们的所有问题行吧,大佬们!
|
34
mscststs 2019-03-30 21:07:34 +08:00
@foru17 在我发完评论以后,我就保护性 Fork 了一份 https://github.com/mscststs/Python-crawler-tutorial-starts-from-zero
不过不知道作者有没有 rebase 的打算 |
35
envylee 2019-03-30 21:10:36 +08:00 1
大家对于「 Works 」的定义不一样,有的人是「创造」,有的人是「收集」,各自都有需求;
也不能强求着每个人都去做些新东西出来;碰上这样的,只能安慰自己一句「夏虫不可语冰」了。 |
36
foru17 2019-03-30 21:12:51 +08:00 1
|
37
loading 2019-03-30 21:21:56 +08:00 via Android 1
|
38
CriseLYJ 2019-03-30 21:23:31 +08:00
|
39
CriseLYJ 2019-03-30 21:24:01 +08:00
|
41
Abbeyok OP 终于能回复了。从另外一个角度上来说 该作者很会迎合小白
|
42
SuperMild 2019-03-30 21:46:27 +08:00
收集整理资料确实也需要付出劳动,如果正确处理,当然也是值得尊敬的。
但是,劳动和辛苦并不能改变资料来源大量非原创的事实,收集数据的时候不乐意记录来源,发布的时候不乐意标明来源,同时却没有忘记加一句“转载请注明来源”,这……一个人的思想这样分裂真的好吗。 |
43
CriseLYJ 2019-03-30 21:49:04 +08:00
@SuperMild 可是我真的没有去抄啊,我整理了好久,这些预备知识,都是些专业知识,都是通用的,这是抄袭吗??我还没写到代码部分,你们这样直接下定论又真的好吗?也不好吧?我们都有自己错误的地方对不对???我是有错!是吧
|
44
Abbeyok OP @SuperMild 借鉴-->创新,我觉得是一个值得赞赏的事情,但是藏着掖着,最后把所有都归为自己的东西,只能说是 shit
|
46
okwork 2019-03-30 21:54:48 +08:00 via Android
你以为 google 这么厉害,有什么原创性的知识吗?不就是把全世界所以的 HTML 全下载到自己的服务器,整理整理给你看?
不要小瞧了收集、整理的传播能力。谷歌同样被很多出版商,原作者称为窃贼啊。 |
48
Allianzcortex 2019-03-30 21:59:17 +08:00
[http 知识你们看百度百科行吧!省的有一些人说抄 https://baike.baidu.com/item/http] ......
|
49
JackieMe 2019-03-30 22:00:13 +08:00 via Android
有心了楼主
|
50
soho776 2019-03-30 22:01:37 +08:00
@Abbeyok 人家的意思就是按照你的逻辑 Google 没有存在的必要,因为 他没有原创任何内容只是把内容收集整理了起来。
|
51
Allianzcortex 2019-03-30 22:01:59 +08:00 7
一个回复里出现大量 !的咆哮体和躺平任嘲的 [你们都是大佬,我是小弟!] 的态度就很难再进行讨论了
|
53
HiCode 2019-03-30 22:06:45 +08:00
没办法,这个世界小白永远多一些,我们也是小白过来的。
技术到了一定程度,就会“看透”这种项目的意义了。 不 star,不评价,无视即可,免得浪费时间。 |
55
Abbeyok OP 所以就理所当然的“抄”
|
56
method 2019-03-30 22:28:48 +08:00 via iPhone 1
Star 已经被中国人玩坏。
|
58
old18 2019-03-30 22:39:47 +08:00
按照楼主的逻辑, 是不是可以理解为任何引用定义的行为都算抄袭?
|
59
winglight2016 2019-03-30 22:40:37 +08:00 4
lz 说得并不过分啊,有借鉴的地方加个引用不是强制性的,然而不加就容易被人诟病,并不是“解释或者不解释”能够应付过去的。我也见过很多一两万 star 的总结性的 repo,基本上都有来源 url。如果是综述性质那就更严格了,动辄上百页的 paper,可能大部分的思想都是“借鉴”来的,但是既有原创性,又有必要的 reference,这种做法才让人心服口服。
|
60
Jzer0n 2019-03-30 22:41:12 +08:00
注明原文连接或引用来源真的那么艰难?无论你处于什么理由,用了别人的东西总得说明吧 2333
|
61
daquandiao2 2019-03-30 22:41:56 +08:00
你的网站被 d 了?
|
62
hasaki1997 2019-03-30 22:42:49 +08:00
虽然我也觉得他的那个项目得到那么多 star 不太正常,但是你这截图举的例子也不是很有代表性吧.我对爬虫不了解,但是那些概念性的话不就翻来覆去那几句吗,他愿意收集起来给小白看,花了时间做这事,你又何必怼他吗
|
63
Senventise 2019-03-30 22:43:42 +08:00 via Android 2
@okwork google 又不是靠做教程出名的…毫无可比性啊
|
64
foru17 2019-03-30 22:44:33 +08:00 via iPhone 1
@xiangyuecn
CSDN,中关村之流那种只丢格式的还算好的了,你可能没见过,一篇文章,从头到尾,包括图片,全文复制,自己换下段落位置,然后说核心内心来自 XX 那种,不带原文外链的,最后也能挂个:转载请标注本站来源😂 国内的版权意识,近年来随着腾讯,知乎和今日头条几家的推进,比以前好了多了,虽然很多人还没有这个意识,也没其他太好的维权渠道,我自己就遇到过照片和视频被别人公司拿去做千万曝光量级的商业广告,跟他们法务交涉起来也是各种麻烦痛苦,那种网上未授权的个人和小平台,随便抄下改下的见怪不怪都懒得管了。 反正这种状况的结果就是,大量内容原创者的权益受损,头部抄袭洗稿的倒能赚得个盆满钵满。 分享一个朋友的的昨天案例 https://i.loli.net/2019/03/30/5c9f7faf9ca0e.png |
65
fhqwt94 2019-03-30 22:47:05 +08:00
仔细读了那个项目里面的部分代码,质量确实比较差,或者说根本没有进行验证过就照抄别人的代码
另外还没有备注引用的来源,被说是必然的 想不通为什么那么多的 star |
66
Abbeyok OP @daquandiao2 有可能哈哈
|
67
singerll 2019-03-30 22:49:01 +08:00 via Android
说专业知识这些内容只能抄的,都没写过毕业论文吗?只要标明某一段落是引自参考文献,就不会算到查重比例里面
|
69
herozzm 2019-03-30 22:51:17 +08:00
是的 github 的项目只要在 V2EX 上稍加宣传,v 站很多人就会纷纷回复谢谢,等有时间好好看看,然后就 star
完全不说自己能否用到用不到,自己用不到,项目再好,和你有毛关系 |
70
CEBBCAT 2019-03-30 23:02:31 +08:00 via Android 2
|
71
alexwu 2019-03-30 23:02:35 +08:00
不管是什么专业知识,都可以用自己的理解写一遍吧,或者至少注明来源
|
73
old18 2019-03-30 23:22:30 +08:00
大家的版权意识让我学习到了.
|
74
CriseLYJ 2019-03-30 23:26:08 +08:00
|
75
CriseLYJ 2019-03-30 23:35:48 +08:00
@Abbeyok 如果你想让我做一个自私的人,那么你做到了兄弟,短短的几分钟,你们就搞崩了我的心态,让我说出了点过与激动的话,对!我没控制住,你赢了行吧,兄弟,现在我就是一个人,我无法发表我的看法,你们是一起的,我喜欢发叹号的事情都会被某个人无限方法,如果你是想要我变成这样的话,你成功了,你很厉害。真的!心服口服行吧!不过我会按照约定发完课程的,这个谁都不能阻止我,还有我已经发了邮件,让管理注销我账号了,哈哈,听到这个应该是挺爽的吧!我也挺爽的,感谢你今天让我变成了这个样子!再见兄弟!
|
80
persimmon 2019-03-30 23:41:05 +08:00 1
That's why we cannot have nice things in China.
|
83
PP 2019-03-30 23:48:19 +08:00 via iPad 13
@CriseLYJ 没人想要摧毁您,也不可能摧毁您,只有您错误的是非观能够做到。
您将别人的劳动成果理直气壮的作为个人搜集来分享,对于已经暴露出来的错误不做自省,以自我毁灭的方式向他人施加虚无缥缈的道义指责,您眼中的世界和是非迥异常人。 或许您的仓库能够帮助一些初学者,可是您的行为直接伤害了几乎所有原创者,并且间接导致初学者没有得到应有的信息更正和知识更新。这样的过程和后果,不会是任何一个理智的人想要的。希望您能够理解什么是真正的创造和传播!祝好! |
85
PP 2019-03-30 23:56:48 +08:00 via iPad
@CriseLYJ 那么,就把它做成能够被人尊重的样子。您和您的成果都会得到感谢和肯定,正如您引用的所有人的作品一样。
|
87
happybird93 2019-03-30 23:59:43 +08:00 via Android
教程之类的原创性要求没有那么高,但是最好标记一下来源,毕竟是人家的劳动成果。楼主也没必要较真,这种 star 数本来也没什么意义,收集过来也不能谋取什么暴利啥的。
|
88
v66ex 2019-03-31 00:04:13 +08:00
@xiangyuecn 身同感受,不是很懂 csdn,是不是有个功能,可以一键转载什么的,我好好的 hexo 博客主题转载了结果格式丢的乱七八糟
|
89
PP 2019-03-31 00:04:24 +08:00 via iPad 1
|
90
yxssfxwzy 2019-03-31 00:07:05 +08:00 via Android
lz 是个妹子多好
|
91
KuzhiBake 2019-03-31 00:09:02 +08:00 via Android
这种事情好像不能完全定义为抄袭的吧。这个“完全靠抄”我觉得有些武断。
|
93
Love4Taylor 2019-03-31 00:10:17 +08:00 via Android
|
94
icekingcy 2019-03-31 00:10:21 +08:00 via iPhone 7
楼主只是不明白当前一个含金量不高(网络收集示例代码 但未经验证且本身质量不高)的项目为何会获得这么多的 Star 而已呀…
只能感觉是当下国内环境很浮躁 大家都是看到牛逼的东西就去收藏点赞,但真正去掌握学习的就很少了。 支持楼主这样较真的人,需要敢去较真的人。 另外项目去提升质量就好了 有真正的创造会让更多人点赞 |
95
azh7138m 2019-03-31 00:24:10 +08:00
这个举例不太对啊,概念性的东西雷同不是挺常见的。
我举一个优秀的例子,有示例代码,还把理论给你讲了,https://github.com/ssloy/tinyraytracer ,star 少有可能是受众门槛高导致的(这里并没有暗示给这个爬虫点 star 的人水平不行 狗头),拿 star 评判一个库的好坏并不合适。 |
96
Terry05 2019-03-31 00:46:45 +08:00
5000+ 就一晚时间被砸成 500+ 啊。。
|
97
SingeeKing 2019-03-31 00:47:12 +08:00
其实 @CriseLYJ #87 的东西是不错的,然而 5K repo 的内容实在是有点… 而且建议写上代码来源(搜集整理也应该保留出处的)
另外,我觉得教程「转载请注明来源」的那句话是没有问题的,而且一些基础的定义类东西在晚上搜索直接粘贴也无可厚非,建议教程开始或者最后加一个「参考文献」来注明一下中间的搜索到的东西都是哪里来的吧 |
98
CriseLYJ 2019-03-31 01:04:12 +08:00
@SingeeKing 好的 谢谢啦,谨记
|
99
likuku 2019-03-31 01:09:00 +08:00
如今 github 的 star 水份也是蛮大的了,别忘了还有 github 账号买卖了(为了简历好看),太在意这些有点浪费时间
|
100
datou 2019-03-31 01:19:03 +08:00
我以为楼主说的李笑来
|