V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
Tyrion
V2EX  ›  Python

17000 张名画,这网站有谁爬一下吗?

  •  
  •   Tyrion · 2019-08-06 12:18:32 +08:00 · 5914 次点击
    这是一个创建于 1946 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://gallerix.ru/

    https://gallerix.asia/

    有没有谁爬下的,图片分享个百度云或者代码丢到 GitHub~(不会写代码的我路过
    第 1 条附言  ·  2019-08-06 13:38:50 +08:00
    1.不花钱悬赏;
    2.只是想问下有没有人有意爬了分享下;
    3.或者曾爬过分享下;
    4.没打算拿来重新做网站 or 卖资源;
    5.看到梁斌微博莫名有了上面想法来发了个贴。

    6.如果确实麻烦或者涉及侵权的话,可以忽略这个事情哈。
    第 2 条附言  ·  2019-08-06 14:15:58 +08:00
    这帖子竟然收藏比回复多……你们都有什么想法,都是仓鼠吗~

    顺便贴下有一层回复的谷歌艺术的地址
    https://artsandculture.google.com/
    loading
        1
    loading  
       2019-08-06 12:27:35 +08:00 via Android   ❤️ 1
    lux182
        2
    lux182  
       2019-08-06 12:32:36 +08:00
    好站
    wizardoz
        3
    wizardoz  
       2019-08-06 12:48:45 +08:00
    是 170000 不是 17000
    Nicoco
        4
    Nicoco  
       2019-08-06 12:54:56 +08:00
    900 ¥,需要的老哥加 v:7474741
    azh7138m
        5
    azh7138m  
       2019-08-06 12:59:05 +08:00   ❤️ 2
    我来翻译一下

    这些图像受版权保护。作者在本网站上发布了复制品,没有授权任何人重新发布的权利。任何使用,包括在您的网站上重新发布,只有在原作者的许可下才允许。
    vinew
        6
    vinew  
       2019-08-06 13:03:00 +08:00 via iPhone
    很赞,收藏了
    tx0
        7
    tx0  
       2019-08-06 13:10:50 +08:00
    我想說的也是,它有版權頁,網站還有防盜措施,所以你想抓取所有圖片的難度不會小,題主怎麼好直接要呢,如果你稍微懸賞一下或許會有人接。(但我還是繞行)

    雖然這個俄文版權頁面主要是網站作者怕被人提告而寫下的:聲明是個人建站,如果侵犯了版權,可以通知他刪除;但大多數名作都是有幾十、至數百年了,版權也已進入公有領域,但通常高清晰度掃描件也是有數字版權的
    kwlokip
        8
    kwlokip  
       2019-08-06 13:17:30 +08:00 via Android
    这个网站居然在我书签里
    licoycn
        9
    licoycn  
       2019-08-06 13:25:41 +08:00
    付费的话应该有人愿意搞
    beijiaoff
        10
    beijiaoff  
       2019-08-06 13:32:22 +08:00
    爬下来也就是满足一下松鼠症吧。实际看特定画的话去谷歌艺术可以看更高清的。一张照片 70 亿像素级别。这个网站普遍不到 0.5 亿像素。
    di1012
        11
    di1012  
       2019-08-06 13:36:02 +08:00
    爬下来,印刷出来,也能卖点钱吧
    zqjilove
        12
    zqjilove  
       2019-08-06 13:39:31 +08:00
    囧,正打算写这爬虫练手
    mixure
        13
    mixure  
       2019-08-06 13:43:15 +08:00
    一打开认识:夜巡 ,蒙娜丽莎, 戴珍珠耳环的少女,什么什么维纳斯。 完了。。。。。
    Tyrion
        14
    Tyrion  
    OP
       2019-08-06 13:52:03 +08:00
    @beijiaoff 我去看看
    Tyrion
        15
    Tyrion  
    OP
       2019-08-06 13:53:30 +08:00
    @di1012 我有这个商业手段就淘宝找人爬了 2333 (不过梁博再问打印成照片有木有人买
    ResidualWind
        16
    ResidualWind  
       2019-08-06 13:58:05 +08:00
    版权 版权
    mengxinbang
        17
    mengxinbang  
       2019-08-06 14:01:00 +08:00
    这种上世纪的名画也有版权吗?
    winglight2016
        18
    winglight2016  
       2019-08-06 14:01:33 +08:00
    这网站内容看起来很眼熟,应该也是别处爬来的
    redford42
        19
    redford42  
       2019-08-06 14:02:16 +08:00
    有空研究下
    zzf2019
        20
    zzf2019  
       2019-08-06 14:05:35 +08:00
    我看看我的水平能不能爬这个网站吧
    sharkrice
        21
    sharkrice  
       2019-08-06 14:24:20 +08:00
    @mengxinbang 拍照的人的照片的版权
    xmai
        22
    xmai  
       2019-08-06 14:38:10 +08:00
    AlexEcho
        23
    AlexEcho  
       2019-08-06 14:49:11 +08:00
    私以为这些网站的价值所在不是这些图片本身,更多的是整理收集管理并持续免费发布并保持可用这个行为本身;

    所以一方面我不知道爬这些站有什么用,另一方面我觉得这是一种有失道义的行为。
    Tyrion
        24
    Tyrion  
    OP
       2019-08-06 14:59:45 +08:00 via Android
    @AlexEcho 这说的,加戏有点多吧。。。
    wordsmatter
        25
    wordsmatter  
       2019-08-06 15:09:15 +08:00   ❤️ 1
    @AlexEcho 赞同。无意针对题主,但这条帖子真的相当于在说,“我发现了一个宅子,里面很多好东西,谁能帮我无偿偷一下,最好再帮我搬到指定的仓库里摆好”。

    BTW,V2 虽然禁止谈论盗版,但爬别人网站的帖子却满天飞,难道这不算是一种盗吗?
    geektony
        26
    geektony  
       2019-08-06 15:11:45 +08:00
    很惊讶,v2ex 有那么多版权薄弱的用户
    xell
        27
    xell  
       2019-08-06 16:22:20 +08:00
    搞艺术史的人来回复一句吧,这个网站根本没有价值,很多画作的清晰度甚至不如维基中的文件质量,遑论与 Google Arts 相比。
    AlexEcho
        28
    AlexEcho  
       2019-08-06 16:52:33 +08:00
    @Tyrion 加您头上了吗
    AlexEcho
        29
    AlexEcho  
       2019-08-06 16:56:43 +08:00
    @wordsmatter 这点上我和你的意思有点区别;

    内容上我觉得这样的爬取到的内容完全是无用而重复的,就像大家不会对着网页把唐诗三百首抄一遍;

    行为上我认为也确实是一种伤害,这点上我们意见是相同的。
    NeedforV2
        30
    NeedforV2  
       2019-08-06 17:45:18 +08:00
    画不错!
    angcz
        31
    angcz  
       2019-08-06 18:41:55 +08:00
    @xell 惊了 v2 居然有学艺术史的?敢问是代码 艺术双修大佬?
    xell
        32
    xell  
       2019-08-06 21:14:03 +08:00
    @angcz #31 完全谈不上大佬,一直都在写和教简单的 App 开发、前端、交互等,但曾经拿到过西方艺术史的 PhD,做的是复杂网络(艺术家构成的人工社会)的虚拟仿真研究。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1401 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 17:41 · PVG 01:41 · LAX 09:41 · JFK 12:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.