V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
tomoya92
V2EX  ›  问与答

碰到有人克隆自己博客该怎么办?

  •  
  •   tomoya92 · 323 天前 · 11387 次点击
    这是一个创建于 323 天前的主题,其中的信息可能已经有所发展或是发生改变。

    前几天发的博客今天我想在谷歌上搜了一下,看被收录的情况如何。结果让我发现了一个克隆站

    这克隆站做的太绝了,所有东西都克隆了(唯独网址是他自己的


    我博客是用 jekyll+github pages 搭建的,访问是个二级域名,估计是权重没有人家 .com 的高,就导致了谷歌搜索结果里他的排名在前

    为了防止被爬虫网站爬博客内容还不留原文链接,我每篇博客里都会手动加上类似下面的原文链接

    链接文原: https://tomoya92.github.io/2021/01/14/spring-cloud-bus/
    

    没想到就连我写死的这个链接的域名也被换了。。

    QQ 截图 20210115090825

    QQ 截图 20210115090854

    以前发现别人转载我博客如果没有留原文链接的话,我都会给人家发邮件联系一下,现在倒好,整个站都是克隆我的博客。真心过分了。

    如果这个克隆站的站长也逛 v2,看到这个帖子后还请停止你的克隆行为(至少原文链接应该保留一下吧),写博客不容易,窃取别人的劳动成果不好玩,谢谢。

    求问,碰到这种情况有什么好的解决办法吗?

    第 1 条附言  ·  323 天前

    感谢大家的评论

    • 评论里说的vscode里直接粘贴截的图插件是 mushan.vscode-paste-image
    • 评论里说可以给图片加水印,我一开始嫌麻烦,后来搜了一下,还真有截图后自动加上水印的软件,软件名是pickpick,有兴趣的v友可以去折腾一下
    • 有很多人问这种克隆站图啥?大致有三个答案
      • 他就是来恶心原站的
      • 他是为了找工作简历上写着好看
      • 他是给自己的域名养权重的
    • 从早上发现到现在,我仅在谷歌上举报了有人镜像我的博客网站,也不知道什么时候有结果

    最后,克隆站的站长,如果你只是为了好玩,还请换位思考一下,尽快停止这种行为。如果是为了简历好看,建议不要做这种临阵磨枪的事,踏踏实实学好自己感兴趣的技术才是正道。如果是为了养你域名的权重,那我是真没办法,只能站在道德的角度在v2发篇帖子谴责一下你这种无耻的行为罢了。

    128 条回复    2021-01-16 12:51:06 +08:00
    1  2  
    wamson
        1
    wamson  
       323 天前 via iPhone
    在博客里放的图打个水印,然后写上其他网站都是克隆的。
    rap16
        2
    rap16  
       323 天前
    图片加水印
    tomoya92
        3
    tomoya92  
    OP
       323 天前
    @wamson #1 没有图片的博客不还是没法区分吗?
    xratzh
        4
    xratzh  
       323 天前
    都是自动爬虫的,文章里加上:本文链接
    tomoya92
        5
    tomoya92  
    OP
       323 天前
    @xratzh #4 我在博客里写死的链接都给换了
    march1993
        6
    march1993  
       323 天前 via iPhone
    写个 js 判断域名自动跳转?
    FlyingShark
        7
    FlyingShark  
       323 天前
    可能被反代了吧?用 js 来检测
    tomoya92
        8
    tomoya92  
    OP
       323 天前
    @march1993 #6 我用的是 jekyll 生成的静态页面,服务器都是 github 的
    Lax
        9
    Lax  
       323 天前
    @tomoya92 #5 链接也用 js 去动态生成吧,也不一定能防得住
    tomoya92
        10
    tomoya92  
    OP
       323 天前
    @FlyingShark #7 不可能是反代,我在这个帖子描述里放了两张图,那是我写在博客内容里的纯文本内容,这都被替换了,怎么可能是反代

    ![QQ 截图 20210115092807]( https://user-images.githubusercontent.com/6915570/104668927-0896e000-5714-11eb-83c6-026f414a3824.png)
    rabbirbot00
        11
    rabbirbot00  
       323 天前
    看了下他是用 dnspod 解析的,尝试联系一下腾讯客服看看能不能停解析,源站没套 CF,IP 是这个 155.235.130.184 打或者联系商家随意吧
    Mithril
        12
    Mithril  
       323 天前   ❤️ 5
    给 Google 发 DMCA
    这人是 DNSPod 买的域名,上去举报
    或者你直接想办法买点 DDOS 直接炸穿它
    PEIENYKYK
        13
    PEIENYKYK  
       323 天前   ❤️ 1
    这 TM 。。。。太恶心了
    maomaomao001
        14
    maomaomao001  
       323 天前
    @原文链接再加个 短链接 (让他们没法自动自断替换 ) 试试
    tomoya92
        15
    tomoya92  
    OP
       323 天前
    @rabbirbot00 #11 谢谢,我先在谷歌上举报一下吧,腾讯那尿性,10 个客服里 11 个都是机器人,指望不上
    tomoya92
        16
    tomoya92  
    OP
       323 天前
    @maomaomao001 #14 这跟图片加水印一样,只能防君子,而且增加写博客的成本
    alect
        17
    alect  
       323 天前   ❤️ 6
    把你自己 GitHub page 套一层 CDN,然后把他的服务器 ip 屏蔽了。
    可以参考这个文章,https://monkeywie.cn/2020/08/20/fast-github-page-with-cloudflare/
    然后 Cloudflare 直接屏蔽它整个 ASN 。
    FlyingShark
        18
    FlyingShark  
       323 天前
    @tomoya92 nginx 扩展可以替换响应内容
    icy37785
        19
    icy37785  
       323 天前 via iPhone
    @tomoya92 反代可以替换文字呀
    xiri
        20
    xiri  
       323 天前 via Android   ❤️ 2
    建议不要把放博客源文件的那个仓库公开访问(看了你的 github,是公开的)。
    这么说吧,我现在完全可以克隆一下你那个仓库,然后改一下配置文件里的域名后重新生成,再复制一个你的博客🙃。
    这种像素级的镜像首先考虑是不是被反代了,如果是静态博客的话则需要考虑我上面提到的是不是博客源文件泄露了,最后才是考虑爬虫。
    zhangolve
        21
    zhangolve  
       323 天前
    所以克隆的那哥们到底图你啥。。。
    KDr2
        22
    KDr2  
       323 天前   ❤️ 4
    先发一篇指出并谴责他是克隆站的 post,看他跟进不。
    tomoya92
        23
    tomoya92  
    OP
       323 天前   ❤️ 1
    @zhangolve #21 我也不知道,感觉就是纯粹来恶心我的
    totoro625
        24
    totoro625  
       323 天前
    想开点,别人浪费一个 .com 域名帮你做博客
    文章更多的是给人看到而不是以何种途径出现在网络上(强行安慰自己)
    例如: https://www.v2ex.com/t/685624
    看了一下是 github 里面下载的 md 文件修改了点主题,没有你的 disqus 和 不蒜子 ,但是他自己加了个 cnzz 统计
    解决办法就是文件放私库,这样别人就下载不到你的 code 了
    PEIENYKYK
        25
    PEIENYKYK  
       323 天前
    插眼,自己的 blog 也有被 clone 的风险
    lovestudykid
        26
    lovestudykid  
       323 天前   ❤️ 4
    kknews 做那么大还活的好好的,举报有用?
    yhy666888
        27
    yhy666888  
       323 天前
    图片水印其实不错,不过我有见过因为原文有水印,搬运者就自己操作了一遍截图放上去
    dddd1919
        28
    dddd1919  
       323 天前
    如果是爬虫+替换的话,可以针对自己文章声明的链接做点处理,防止被替换掉

    1.把自己文章的 github.io 链接转成短链接,而且最好用多个短链接服务
    2.链接加点分隔的随机文本转 base64 保存,然后用 js 动态反解
    douza
        29
    douza  
       323 天前
    @yhy666888 文字也用图片加水印呗。
    tomoya92
        30
    tomoya92  
    OP
       323 天前
    @KDr2 #22 说实话,我怕被倒打一耙,我发一篇谴责这个克隆站的博客,这个站长应该有两种选择

    1. 无视,只转技术博客
    2. 同样克隆,然后把黑的改成白的,再发出来,他网站权重比我要高,到时候说是我镜像他的网站,我就哭死也说不清了。
    0312birdzhang
        31
    0312birdzhang  
       323 天前
    2021-01-15 09:51 克隆站已无法访问
    tomoya92
        32
    tomoya92  
    OP
       323 天前
    @dddd1919 #28 这种成本对我来说高了,细心的 v 友应该会发现去年有大半年没有更新博客了,就是因为图片麻烦,截个图,先要放在相应的文件夹里,然后还要手动写 md 语法引入图片。

    年底的时候在 vscode 上找到了一个插件,直接截图在 vscode 里粘贴就可以了,这才继续更新博客了

    所以加短链,图片加水印这种操作,我是宁愿关了博客也不会弄的。真心麻烦
    xratzh
        33
    xratzh  
       323 天前
    @zhangolve 估计是多采集,然后做排名,放广告,隔壁 loc 大佬太多了
    tomoya92
        34
    tomoya92  
    OP
       323 天前
    @0312birdzhang #31 我还可以访问
    Tink
        35
    Tink  
       323 天前
    这是反代吧?
    Tink
        36
    Tink  
       323 天前
    @tomoya92 #10 谁告诉你内容替换就不能反代了啊,很多人反代 sis 这种网站就是为了屏蔽广告啊
    0312birdzhang
        37
    0312birdzhang  
       323 天前
    @tomoya92 #34 又可以了。。。
    tomoya92
        38
    tomoya92  
    OP
       323 天前
    @Tink #36 呃,我是真不知道,孤陋寡闻了 : )
    newtype0092
        39
    newtype0092  
       323 天前   ❤️ 1
    额。。。我看成有“碰到有赛博人克隆自己该怎么办”。。。。
    Tink
        40
    Tink  
       323 天前
    @tomoya92 #38 说实话,刚点开看了下你这个网站,反代+替换真不难,建议你直接把这个网站的 ip 屏蔽掉
    gaogao321
        41
    gaogao321  
       323 天前
    @0312birdzhang 2021-01-15 10:03 克隆站仍然可以正常访问
    odi
        42
    odi  
       323 天前
    其实有点远了,写博客的目的,不就是传播么,,,还是就只为了一个博客网站。

    那么除了技术上能做的,加链接,加各种链接,图片打码,,,文字也可以阿。文中多出现自己博客名字,不局限于同一种格式,尽量增加对方 替换的难度 ?
    cherryas
        43
    cherryas  
       323 天前
    其实可以加点文字水印,只要这个网站不能盈利人家克隆你证明你的内容有价值。加点文字水印保证真的做起来是自己原创的。
    tomoya92
        44
    tomoya92  
    OP
       323 天前   ❤️ 1
    @odi #42 话是这么说没错,但自己辛辛苦苦写的博客被别人就这么拷贝走了,从心里上还是难以接受的
    tomoya92
        45
    tomoya92  
    OP
       323 天前
    @Tink #40 我没法屏蔽 ip,服务器是人家 github 的
    zy445566
        46
    zy445566  
       323 天前 via Android
    我的博客也被别人 fork 过,有利有弊。他既然要给你做宣传,你就写博客的时候多埋点,多在里面时不时贴不同的社交账号。那始终会把流量又重新引导到自己身上。
    Tink
        47
    Tink  
       323 天前
    @tomoya92 #45 外面在套一层 nginx 或者其他什么啊
    pockry
        48
    pockry  
       323 天前
    你再去开个公众号,往公众号导流,然后就变成了别人免费给你增粉,那不是获得免费流量?
    wangpao
        49
    wangpao  
       323 天前
    哈哈哈哈,看成克隆人
    vanityfairn
        50
    vanityfairn  
       323 天前
    楼主的地址,我居然访问被限制了,贴图:

    https://i.bmp.ovh/imgs/2021/01/531c3fae0e543df7.png
    zfish
        51
    zfish  
       323 天前   ❤️ 2
    最好的解决办法是在页面的所有版本中使用 rel="canonical"链接元素,标明哪一个版本是最原始的版本。

    当你和第三方联合发布内容时也会出现上述类似的情况,原因是搜索引擎可能会将文章的副本从搜索结果中过滤掉,转而使用文章被重新发布的版本,这一问题的三个解决方案如下:

    1. 要求重新发布文章的负责人使用 rel="canonical"链接元素标签将内容链接回你网站的原始页面,这能够让搜索引擎知道你的页面才是最原始的,任何进入重新发布页面的链接都会被记入在原始页面中。

    2. 让合作伙伴在内容副本中添加 noindex 标签,这会阻止复制版本进入搜索引擎索引,同时,该内容中任何链接回你网站的链接仍然还能够将链接权限传递给你。

    3. 要求合作伙伴链接回你的网站的源页面,你这样做的话,搜索引擎通常都能正确理解这一做法并重点突出你内容版本。但需要注意的是,有些情况下,谷歌会将内容的原创性归于重新发布的网站,尤其是当重新发布的网站比内容实际的源网站权威性和信任度更高时。

    ---

    你可以使用各种在线工具轻松找到侵权者,包括 Plagium 和 Copyscape 。但如果他们把侵权者的权限包含在你的设计中,处理就会更加困难。有以下 5 个处理侵权的办法:

    发送 DMCA (数字千年版权法案)侵权通知。
    联系侵权公司的 CEO 、销售主管、法律顾问或任何人,或者任何你觉得最有可能回应的人。
    如果不是自托管,通知该网站的托管公司。
    报告你的博客活动,或者如果你的博客不受欢迎,用受欢迎的博客进行举报。
    让你的律师发出侵权停止和终止函。
    ZHanYao
        53
    ZHanYao  
       323 天前   ❤️ 4
    emmmm...并不完全一样,你的有广告,克隆站没有[手动狗头]
    austfisher
        54
    austfisher  
       323 天前
    名字都爬过去的话 岂不是你的博客分站
    cndota
        55
    cndota  
       323 天前
    牛逼牛逼,想学学这个克隆网站怎么做到的 /doge
    tomoya92
        56
    tomoya92  
    OP
       323 天前
    @vanityfairn #50 是这个域名被国内给墙了 github.io ,不是我博客的问题
    tomoya92
        57
    tomoya92  
    OP
       323 天前
    supermao
        58
    supermao  
       323 天前
    我也想知道是怎么做的克隆,看着样式都一样,看着是 md 内容,是整个 html 内容 copy 过去还是把 md 逆向之后存数据库,还是怎么个回事呢?纯好奇。
    jfcdada
        59
    jfcdada  
       323 天前 via Android
    加个广告 让他帮你代宣传??
    supermao
        60
    supermao  
       323 天前
    只是想不到就是说这样 copy 有啥意义
    arvinsilm
        61
    arvinsilm  
       323 天前   ❤️ 4
    来个杀敌一千自损不知道多少的办法
    测一下克隆时间,掐时间点发点 FAN 动信息,等它克隆过去后,自己博客里的马上删掉。举报给狗日的腾讯,保证立马挂掉
    Jh1n
        62
    Jh1n  
       323 天前
    @arvinsilm 是个狼灭
    tomoya92
        63
    tomoya92  
    OP
       323 天前
    @arvinsilm #61 这种事不敢干 :joy
    ai277014717
        64
    ai277014717  
       323 天前
    之前尝试“破解”某站点时,调了一个未鉴权的接口直接把我 ip ban 了。。。可以参考下。在 js 里放点料。
    sunny352787
        65
    sunny352787  
       323 天前
    看了一下请求,应该是做了反向代理
    keepeye
        66
    keepeye  
       323 天前
    被盯上的话,这个真的很难防的
    zfish
        67
    zfish  
       323 天前
    @tomoya92 发送 DMCA (数字千年版权法案)侵权通知吧,具体流程我没操作过,但是 Google 对于克隆站是有一套专利去识别谁是源站的,如果它的排名比你高,那很可能占据了域名优势,老域名权重比你高,这种情况只能给 Google 或者主机厂商发 DMCA 了。
    keepeye
        68
    keepeye  
       323 天前
    你发一个文章声明那个站是抄袭,然后看对方会不会无脑采集这篇文章
    lucybenz
        69
    lucybenz  
       323 天前
    对方应该是收集了各种教程 但是他只把你的这部分放到首页了,其它的都藏在分类目录里 http://www.lachuaica.com/category/ 所以猜测 他应该是手动收集整理的
    sunny352787
        70
    sunny352787  
       323 天前
    看这意思是拿你的 blog 刷这个域名的权重做 SEO,后续估计会修改指向做他自己要做的事
    zfish
        71
    zfish  
       323 天前
    @tomoya92 还有一个笨办法,你可以在知乎或者其他大的平台上先发布内容,等一段时间再在博客上发布,然后知乎这类平台上把原文链接到你的博客上,这样可以指导搜索引擎发现谁是原作者,如果他敢在知乎上抄袭你内容,那直接给知乎举报就好了。一般一篇文章发布到知乎,很快就被收录了,这种大站权重很高。
    SmallTeddy
        72
    SmallTeddy  
       323 天前
    文章整个用 image 渲染,然后 image 加上北京水印
    tomoya92
        73
    tomoya92  
    OP
       323 天前
    @lucybenz #69 不不,你把他这域名换成我博客域名,会发现也是一样的,这是我更新博客主题之前遗留的页面,我没把它展示出来,还有一个 /tag/ 现在也能访问
    tomoya92
        74
    tomoya92  
    OP
       323 天前
    @keepeye #68 22 楼有 v 友已经提出这意见了
    xiaorande
        75
    xiaorande  
       323 天前   ❤️ 1
    克隆绵羊没爹没娘
    eason1874
        76
    eason1874  
       323 天前   ❤️ 2
    @supermao #60 意义就是用博主的原创内容给自己的域名养权重,让搜索引擎认为这个域名的网站有稳定高质量更新,之后发自己的内容也会很快被收录而且有不错的排名,这是站群的玩法之一。有一些菠菜站群连 gov 网页都敢反代。

    @tomoya92 静态站被采集被反代,很难反抗。

    要是真的在意,你注册个便宜域名来绑定,稍微短一点的。全部图片都打上倾斜多行排列半透明的域名水印,反正技术图片,这样也不影响观看。分享的代码的类名和注释那些时不时写上一些特有名词,比如 tomoya92UserFilter

    到谷歌站长平台提交你的域名和站点地图,连续几次发布了新文章第一时间去站长平台点抓取,应该很快就会有排名了。
    cf020031308
        77
    cf020031308  
       323 天前
    我也遇到过别人直接 fork 的,除了觉得这有点没礼貌以外(我预想的是你发个邮件来拍一下马屁嘛),其实无所谓。
    本来我写东西就是为了自己精进,也不搞公众号什么浪费时间的。
    说到底,我觉得(就我写的那些)代码、笔记都算不得壁垒,谁爱用谁拿去用,不值得花精力纠结。
    Kilerd
        78
    Kilerd  
       323 天前
    也挺好,证明你写的东西有人关注了。
    supermao
        79
    supermao  
       323 天前
    @eason1874 有意思啊
    ZhaoHongXuan
        80
    ZhaoHongXuan  
       323 天前
    @tomoya92 求 vscode 插件啊。找好久这种插件了
    tomoya92
        81
    tomoya92  
    OP
       323 天前
    @ZhaoHongXuan #80 mushan.vscode-paste-image
    tomoya92
        82
    tomoya92  
    OP
       323 天前
    @zfish #71 感谢,不过我懒得折腾的,目前就只在谷歌搜索上举报了一下
    radiocontroller
        83
    radiocontroller  
       323 天前
    看了前面的回复,已经把博客 repo 改成 private 了
    tomoya92
        84
    tomoya92  
    OP
       323 天前
    @radiocontroller #83 改成私有的之后,github pages 还能访问吗?
    yulgang
        85
    yulgang  
       323 天前
    有点意思,蛤蛤蛤蛤

    JS 判断一下域名,不是你的就跳回你的站,然后做一下混淆加密。
    encro
        86
    encro  
       323 天前
    人家网站速度比你快,还没广告。哈哈

    我们一个商业网站,模仿的有几十家,有几家图都不换,品牌都没换。
    iYY
        87
    iYY  
       323 天前
    这头像都不换啊
    hsjylaji
        88
    hsjylaji  
       323 天前
    我还以为你碰到克隆人了
    abersheeran
        89
    abersheeran  
       323 天前   ❤️ 1
    看到你博客都是讲 Java Sprint 的,说句老实话,因为培训班的问题,Java 程序员群体几乎是中国平均素质最低的程序员群体……我 Python 也即将沦陷。

    看看隔壁搞 Rust 的。有时候不禁感概,门槛高一点,世界真的会清净很多。
    abersheeran
        90
    abersheeran  
       323 天前
    @abersheeran 手快打错字了。Spring
    77alex
        91
    77alex  
       323 天前
    弄点 zz 敏感信息,然后一波举报就行
    DoubleWay
        92
    DoubleWay  
       323 天前
    @tomoya92 想问下这个是什么插件 我和你一样通过 github 来搭建的博客,图片确实比较麻烦
    bofei
        93
    bofei  
       323 天前
    碰到有人克隆自己怎么办?
    tomoya92
        94
    tomoya92  
    OP
       323 天前
    @DoubleWay #92 mushan.vscode-paste-image
    amiwrong123
        95
    amiwrong123  
       323 天前
    在 csdn 写博客的话,就算被克隆了也不用担心自己的权重比别人低了~
    tuwulin365
        96
    tuwulin365  
       323 天前
    遇到克隆人怎么办?
    AsiaToyo
        97
    AsiaToyo  
       323 天前
    这种应应该是采集了,域名很好替换。建议图片添加水印。静态博客比较难生成不规则 class 。
    ccreading
        98
    ccreading  
       323 天前
    我是图片加的水印,用 1drv 的直链 http://www.blog.stdfirm.com/
    caopi
        99
    caopi  
       323 天前
    @zhangolve 现在求职有个自己的博客在简历上比较加分,自己不愿意做有的人就复制别人的
    radiocontroller
        100
    radiocontroller  
       323 天前
    @tomoya92 我有自己的机子,所以不清楚 github pages 行不行
    1  2  
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1745 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 16:46 · PVG 00:46 · LAX 08:46 · JFK 11:46
    ♥ Do have faith in what you're doing.