V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
windowsuuy
V2EX  ›  程序员

国内的百科网站真的烂的无可救药了,特别是百度

  •  
  •   windowsuuy · 2019-03-01 10:26:30 +08:00 · 9561 次点击
    这是一个创建于 2093 天前的主题,其中的信息可能已经有所发展或是发生改变。
    70 条回复    2019-03-02 16:45:11 +08:00
    jinksw
        1
    jinksw  
       2019-03-01 10:29:37 +08:00
    貌似赌 x,x 色网站都爱用申请别人用过的过期的域名
    TRIKING
        2
    TRIKING  
       2019-03-01 10:32:23 +08:00 via Android
    这种抢注过期域名貌似真没什么好办法防治
    fengci
        3
    fengci  
       2019-03-01 10:34:10 +08:00
    求你救救他们把
    picone
        4
    picone  
       2019-03-01 10:36:22 +08:00   ❤️ 2
    你行你上?意见又不给就吐槽
    agagega
        5
    agagega  
       2019-03-01 10:37:25 +08:00 via iPhone
    恰烂钱
    lfzyx
        6
    lfzyx  
       2019-03-01 10:38:40 +08:00   ❤️ 5
    萌娘百科 了解一下?
    v2chou
        7
    v2chou  
       2019-03-01 10:39:46 +08:00   ❤️ 1
    这种程序很难预防吧,以前我一个备案域名后来没续费了,直接被人抢注过去做赌*网站了,备案信息还没删除,后来要新备案网站才知道,弄了好久才把那个备案信息删除了
    jmercer
        8
    jmercer  
       2019-03-01 10:43:04 +08:00
    新大陆嘛
    jadec0der
        9
    jadec0der  
       2019-03-01 10:46:06 +08:00 via iPhone   ❤️ 2
    这关百度什么事,广州上学网倒闭的时候通知百度了?
    miniwade514
        10
    miniwade514  
       2019-03-01 10:49:45 +08:00   ❤️ 7
    楼上几位泼冷水的,真要做治理,也不是没有一点办法吧?又没有让你治理抢注过期域名这个现象,只是治理自家页面上的外链。
    爬取参考资料里面的链接指向的页面,解析页面上的关键词,鉴定是否黄赌网站。百度就是做搜索引擎+人工智能的,对他们来说很难吗?
    更多是因为这是一个“负向”工作(不能直接带来关键数据增长),所以没人愿意投入精力去做吧。
    LicV587
        11
    LicV587  
       2019-03-01 10:56:19 +08:00
    u can u up, no can no BB
    hanbing135
        12
    hanbing135  
       2019-03-01 10:58:47 +08:00 via Android   ❤️ 3
    百度是全面的垃圾
    liuxey
        13
    liuxey  
       2019-03-01 11:02:09 +08:00   ❤️ 2
    这件事情,百度百科没有问题,但是我还是要说:百度 sucks
    DOLLOR
        14
    DOLLOR  
       2019-03-01 11:04:53 +08:00   ❤️ 4
    国内的百科网站确实不好,但是你黑要黑到点上。你列出的这条资讯里,是因为广州上学网关站后,原域名被不良网站抢注,从而导致来自其他网站的链接失效而导致失误的。核心问题是“过期域名被黑产利用”,跟百科好不好关系不大。
    droiz
        15
    droiz  
       2019-03-01 11:05:04 +08:00
    别问,问就 wikipedia
    jianzhao123
        16
    jianzhao123  
       2019-03-01 11:10:32 +08:00 via iPhone
    果然,百度上貌似所有关于广州上学网的东西都没了……包括百度知道(:
    caqiko
        17
    caqiko  
       2019-03-01 11:12:16 +08:00 via Android
    @DOLLOR 楼主的意思是百度百科有必要不定期的检测并更新外部饮用信息的有效性。
    DrPikaduo
        18
    DrPikaduo  
       2019-03-01 11:15:12 +08:00
    我觉得百度得对搜索内容负责,我不提竞价的事情,就是说你可以有广告,但是也得有我需要的信息,最好不要有不良信息,但是结果并不是这样的
    1648820920
        19
    1648820920  
       2019-03-01 11:16:35 +08:00
    这很正常吧,例如我去查一个规划,规划上面有当时规划局的网址,然后规划局改网址了,那个规划公示上面就有黄网的网址了。基本无解。。
    windowsuuy
        20
    windowsuuy  
    OP
       2019-03-01 11:17:27 +08:00
    @DOLLOR 我可没有黑它的意思,我只是在陈述一个事实,既然百科是百度下属一个网站,那么它就有责任分辨出里面的信息是否是好还是坏,你说是吧
    windowsuuy
        21
    windowsuuy  
    OP
       2019-03-01 11:18:17 +08:00
    @DrPikaduo 我觉得也是
    windowsuuy
        22
    windowsuuy  
    OP
       2019-03-01 11:19:23 +08:00
    @droiz wikipedia 不是每个人都能用的呀,大部分人还是用的百度更多
    LicV587
        23
    LicV587  
       2019-03-01 11:20:32 +08:00
    @windowsuuy 既然微信是腾讯下属一个产品,那么它就有责任分辨出用户发送的消息里面的信息是否是好还是坏,你说是吧
    既然淘宝是阿里下属一个网站,那么它就有责任分辨出里面商品是否是正版还是盗版,你说是吧
    windowsuuy
        24
    windowsuuy  
    OP
       2019-03-01 11:25:11 +08:00
    @LicV587 你举得的第一个例子显然不合适,微信和腾讯属于同一家公司但是微信里面发送的信息属于个人隐私,而百科与淘宝里面的商品属于正版还是盗版属于公开信息。
    alfredsun
        25
    alfredsun  
       2019-03-01 11:28:46 +08:00   ❤️ 2
    楼上的这些人的气质和这些百科很相符了 XD
    LicV587
        26
    LicV587  
       2019-03-01 11:33:23 +08:00
    @windowsuuy 并不觉得第一个例子不合适,你只有微信账号的使用权,并没有所有权,所以,严格来说,你在微信里发送的信息并不属于隐私
    honist
        27
    honist  
       2019-03-01 11:34:56 +08:00 via iPhone   ❤️ 4
    互联网上的链接那么多 咋能一个一个验证? 就算验证 也有时效性,以及误判可能。

    为什么楼主不要求这种域名在注册时相关部门就审核内容?
    为什么不要求监管部门在网站上线之初就封掉呢
    loveour
        28
    loveour  
       2019-03-01 11:41:30 +08:00   ❤️ 2
    看了新闻链接,这个应该是很难保证的,看里面的描述,百度应该是有扫描外链,只是频度不够。说实话,我不是特别赞同厂商承担过度的责任,毕竟,有个成本问题。就好像警方破案也是要讲成本的。不过这个度在哪儿,感觉还是可以讨论的。
    loveour
        29
    loveour  
       2019-03-01 11:42:52 +08:00
    以及,我相信类似问题没有网站能完全保证,Youtube 还刚被爆存在儿童色情群体找视频的情况呢。完全的责任就意味着没办法做事了。
    CEBBCAT
        30
    CEBBCAT  
       2019-03-01 12:10:49 +08:00 via Android
    想了想,维基百科没法躲得过这个


    但我们允许机器人帮忙验证有效性啊 洋洋得意. gif
    windowsuuy
        31
    windowsuuy  
    OP
       2019-03-01 12:35:30 +08:00
    @LicV587 你这个不对,比如你租了一个房子你只有使用权对吧,就跟微信一样,但是你在房间里做什么,放什么,属于你的个人隐私
    orvice
        32
    orvice  
       2019-03-01 12:46:15 +08:00
    维基百科的引用来源相对不会是这种小网站
    sowish
        33
    sowish  
       2019-03-01 12:53:29 +08:00
    错误就是错误,无脑开喷就不对了
    580a388da131
        34
    580a388da131  
       2019-03-01 12:59:43 +08:00 via iPhone
    互联网链接真是一点都不保险,应该再弄个页面缓存。
    aimiyooo
        35
    aimiyooo  
       2019-03-01 13:22:32 +08:00
    就问你一句,为什么要用百度呢
    sugars
        36
    sugars  
       2019-03-01 13:29:15 +08:00
    这百度... 打开 gzshangxue 后吓我一跳
    janus77
        37
    janus77  
       2019-03-01 13:29:53 +08:00
    都懒得说了,因为已经是不需要强调的事了
    Jzer0n
        38
    Jzer0n  
       2019-03-01 13:31:38 +08:00
    声明:和任何百科无任何利益关系。

    虽然我是看维基百科的,看了链接的内容,本身文章标题就不够严谨(外链是否以“个别外链”代替更准确?),楼主你标题的判断又是基于什么来做判断?你贴的那个链接的一篇文章个人觉得并不能就可以得到你标题的结论。
    windowsuuy
        39
    windowsuuy  
    OP
       2019-03-01 13:35:45 +08:00
    @aimiyooo 我一般不用啊,但是我不用,不代表其他人不用,我只是把问题贴出来希望引起更多的人去注意它,去监督它,这样别人才能用到更好的产品,才能让厂商知道自己的错误。
    windowsuuy
        40
    windowsuuy  
    OP
       2019-03-01 13:36:32 +08:00
    @sowish 可没人无脑开喷,不知道你的无脑是怎么得来的
    l00t
        41
    l00t  
       2019-03-01 13:40:10 +08:00
    不认为百度有这个责任去验证外链是否有效。
    Greendays
        42
    Greendays  
       2019-03-01 13:43:21 +08:00
    我是不知道这种东西该怎么防备,百度的反应也已经很快了。
    icyalala
        43
    icyalala  
       2019-03-01 14:24:20 +08:00
    我很像知道百度(或者 Google、维基百科)这种网站责任的边界在哪里。。
    外链网站改版,内容和标题不符了,是否要负责?
    外链网站临时挂了,是否要负责?
    外链网站被临时挂马了或者受攻击了,是否要负责?
    外链网站什么都没变,但是政策变了,原本里面只是个食物名称,现在变成敏感词了,是否也要负责?
    Heiban
        44
    Heiban  
       2019-03-01 14:28:03 +08:00 via iPhone
    @windowsuuy #22 国内百科有大大小小各种问题,有些词条里面还有广告属性。总的来说不够严谨
    kzfile
        45
    kzfile  
       2019-03-01 14:30:03 +08:00
    你们都在讨论对错?
    我在想我如果要实现预防类似的问题,该如何下手
    zxcslove
        46
    zxcslove  
       2019-03-01 14:32:04 +08:00
    作为百科网站不算做错只能说是不够好,同时作为一个搜索引擎公司就挺丢人。
    NekoPr
        47
    NekoPr  
       2019-03-01 14:33:29 +08:00
    以后给页面做快照不就好了,既锁定了内容,又保证了即使以后变更导致被解析到奇怪的网站,话说回来,估计改百科的这个人也没想到事情能闹的这么大 2333333
    lfzyx
        48
    lfzyx  
       2019-03-01 14:35:02 +08:00
    @honist 我觉得你的观点和 申纪兰 有的一拼~ 为什么要封掉网站?为什么要审核内容?成人网站对于成人来说就是合法浏览的。
    xianxiaobo
        49
    xianxiaobo  
       2019-03-01 14:41:36 +08:00   ❤️ 2
    吐槽多容易啊,随便拿个产品,我都能找到无数个槽点,那你倒是提出解决办法啊
    sowish
        50
    sowish  
       2019-03-01 14:59:29 +08:00
    @windowsuuy 无脑是只会开喷,遇到问题难道不是提出解决办法吗
    jadec0der
        51
    jadec0der  
       2019-03-01 15:03:52 +08:00
    我觉得这个问题可以分为两部分:

    1. URL 指向的内容是会变的。一个 URL,以前内容是算法,打开后可能变成了厨艺,这是正常的。这就是 Tim 设计万维网的初衷,一个松散的分布式网络。当你留下一个 URL 作为 reference 的时候,它可能会越来越完善,也可能改变主题,也可能 404 了。正是这种不太严格的设计让 www 超过同时代的竞争者,成为互联网的主流。

    2. 一个网站的内容可能是「违法」的。这就是另一个问题了,而且肯定不是百度的责任。
    calpes
        52
    calpes  
       2019-03-01 15:14:43 +08:00
    @icyalala 技术伦理问题
    windowsuuy
        53
    windowsuuy  
    OP
       2019-03-01 15:30:42 +08:00
    @sowish 麻烦指出无脑点与开喷点。
    Jelen
        54
    Jelen  
       2019-03-01 16:24:05 +08:00
    百度百科内容和审核机制确实存在问题,举个栗子:
    查询福田区的一个街道,在同一个页面的三个区域,说明街道有多少个社区时,分别出现了 13、14、15 三个不同的说法。这是明显的错误。
    我去编辑正确的并提交之后,第一次竟然给我退回来,说因为样式的问题,审核不通过,真是滑稽。
    我再次提交之后才给通过了。
    你无法校对内容也就罢了,别人修正的你至少认真核对一下吧。。
    whatsmyip
        55
    whatsmyip  
       2019-03-01 16:33:32 +08:00
    是不是可以专门找一下类似的,然后去举报一波?:doge:
    LicV587
        56
    LicV587  
       2019-03-01 16:44:39 +08:00
    对有些人来说,百度的责任无限大,百度的权利无限小,喷百度无限正确,赞百度无限错误。现在喷百度已经是互联网的政治正确了
    kid177
        57
    kid177  
       2019-03-01 19:08:41 +08:00   ❤️ 4
    v 站和逼乎现在基本都是见百度就无脑黑,这个我就不说了。

    针对这个问题,我们来讨论下所谓方案的可行性,现在大家比较认同的方案就是,百度应该通过技术手段去验证外链文字描述和实际对应的外链到底是不是「相关」。

    1).你想到了这个方案,并不代表百度没做这件事,稍微做过策略的人都知道任何策略都是有准确率和召回率的,可能这个 case 刚好是没被召回(不过这也只是我的推测),而且「内容相关」这个问题,了解下 NLP 就知道,其实并不简单,不要认为这件事很好做。你非要和我杠,百度就是个技术公司,做不好丢脸,那我也无话可说。

    2).如果策略识别出来这个外链是有问题的,那准备对这个外链怎么处理。你要替换成正确的内容这个几乎不可能,你是不知道他真实对应的外链应该是哪个,那如果直接删了或者给个风险提示呢。上面说了策略都是有准确率的,万一你误识别了,给别人好的外链删了或者提示了,那是不是又是一波节奏,万一恰巧还是把竞品或者重要词条给提示了呢。那这个节奏估计又要带的飞起了。

    所以大家还是理性点,提方案很简单,实施起来真没那么容易。并不是不能黑百度,但是也别瞎逼黑啊
    nosky
        58
    nosky  
       2019-03-01 19:14:45 +08:00
    @lfzyx 你指的是哪种成人网站,sex 网站在中国是触犯了刑法的
    whwq2012
        59
    whwq2012  
       2019-03-01 19:15:56 +08:00 via Android
    不能只有百度背锅,他只是个平台而已。这还得靠百度和用户合作才能解决。
    yingfengi
        60
    yingfengi  
       2019-03-01 19:28:31 +08:00 via Android
    讲道理,这种锅百度不背啊
    snw
        61
    snw  
       2019-03-01 20:36:38 +08:00 via Android
    @lfzyx 萌百是立足美利坚啊,虽然后来站长被现实拍醒,回国内注册了公司。
    Shintaku
        62
    Shintaku  
       2019-03-01 20:53:02 +08:00 via Android
    每日一黑 1/1
    baskice
        63
    baskice  
       2019-03-01 21:05:12 +08:00
    你这地图炮开的,不过我们也不是大陆网站
    tabris17
        64
    tabris17  
       2019-03-01 21:08:40 +08:00
    gzshangxue (点) com ?
    livc
        65
    livc  
       2019-03-01 21:19:17 +08:00
    脉脉的氛围倒是理性很多,同样是程序员,差距真大。
    yann1992
        66
    yann1992  
       2019-03-02 02:50:32 +08:00
    做技术的也这么无脑黑?就不能理性地讨论问题?这个问题真的是百度的锅?
    soho776
        67
    soho776  
       2019-03-02 09:28:32 +08:00
    乱喷,这个事情的重点是,网站变成了色情网站为啥国内还能正常访问那,伟大的墙,这个时候为啥不发挥他应有的作用那?
    superbai
        68
    superbai  
       2019-03-02 12:50:18 +08:00
    讲真,从综合素质来说,百度百科应该算是国内做的最好的了吧
    MaiKuraki
        69
    MaiKuraki  
       2019-03-02 15:15:22 +08:00
    维基百科中文版本更垃圾
    sobigfish
        70
    sobigfish  
       2019-03-02 16:45:11 +08:00
    百度作为一个搜索引擎时时都在爬网页,验证引用的网页很容易就是懒的占用资源而已。
    但也不能全怪 wiki 服务商,出问题了提交个修改就是了(除非他们主动禁止你的修改)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1496 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 17:15 · PVG 01:15 · LAX 09:15 · JFK 12:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.