V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
matthewgao
V2EX  ›  分享创造

想搞个统计新冠感染者的网站,就叫”我阳了"

  •  
  •   matthewgao ·
    matthewgao · 2022-12-11 00:24:14 +08:00 · 4567 次点击
    这是一个创建于 717 天前的主题,其中的信息可能已经有所发展或是发生改变。

    考虑到现在检测也不做了,最近各地疫情到底什么程度了,没有什么可以衡量风险的指标了,想搞一个网站,阳了的人可以顺手点一下,做个计数,每天可以统计全国各地细分到街镇的新增数据,以及新增趋势,从而得到一个风险系数。

    逻辑很简单,只是计数,按天按地点 group by ,提供一些曲线和地图热点,匿名,只根据 ip 去重

    不知道有价值不,或者是不是已经有类似的了

    34 条回复    2022-12-21 00:28:38 +08:00
    swulling
        1
    swulling  
       2022-12-11 00:27:06 +08:00 via iPhone   ❤️ 9
    中国版的约翰霍普斯金大学统计么

    小心被境外势力利用啊,就像上述统计被我党利用一样
    bjzhush
        2
    bjzhush  
       2022-12-11 00:27:47 +08:00   ❤️ 1
    统计数据有价值的一个前提就是采用一些方案或者逻辑保证收集数据的合理性以及消减误差。
    但是你这种统计方法,得到的数据随机性和偏差估计都比较大,所以个人认为价值不大,除非达到一个巨量的数据集合
    matthewgao
        3
    matthewgao  
    OP
       2022-12-11 00:33:43 +08:00
    @bjzhush 不追求完全合理性,那毕竟不是民间力量可以的,只想给个模糊的趋势
    qinrui
        4
    qinrui  
       2022-12-11 00:35:42 +08:00 via iPhone
    阳的人不点怎么办?不阳的人点了怎么办?
    matthewgao
        5
    matthewgao  
    OP
       2022-12-11 00:38:03 +08:00
    @swulling 那做不到,只是个简单的参考趋势而已,不过突然觉得用公网 IP 做去重有点问题。。
    olaloong
        6
    olaloong  
       2022-12-11 00:40:00 +08:00 via Android
    啥校验也没有,太玩具了,不比直接瞎编数据靠谱多少
    matthewgao
        7
    matthewgao  
    OP
       2022-12-11 00:40:11 +08:00
    @qinrui 所以这里其实关注的是概率,并不是绝对数字
    leloext
        8
    leloext  
       2022-12-11 00:49:59 +08:00
    想问一个问题:同一个人用各地代理刷怎么排重呢?
    EminemW
        9
    EminemW  
       2022-12-11 01:07:19 +08:00
    加个设备指纹校验吧
    cnrting
        10
    cnrting  
       2022-12-11 01:10:42 +08:00 via iPhone
    快进到被封
    matthewgao
        11
    matthewgao  
    OP
       2022-12-11 01:29:10 +08:00
    @leloext 其实我考虑这个问题更多的是从概率的角度,就是他总归是有各种噪音的,如果有效内容足够多,则噪音就可以不管他,另外这个东西绝对简单,不涉及任何利益和可盈利的点,所以会假设这种动机也很少,当然肯定是有就是故意破坏的,所以这点上确实,但是呢 又不想加太多的校验内容怕降低参与意愿,最多有个校验码,但是这种我觉得都会降低人参与的意愿
    uov
        12
    uov  
       2022-12-11 01:33:12 +08:00 via Android
    可邢可拷
    哈哈😃
    pengpengpeng
        13
    pengpengpeng  
       2022-12-11 02:18:56 +08:00
    我有个绝美匹配的双拼域名,可惜怕被搞 hold 了, 算了。
    molezznet
        14
    molezznet  
       2022-12-11 03:05:49 +08:00   ❤️ 2
    主要问题是网络民意真的只代表少数
    虽然网民多
    但是愿意发表的不多
    所以我还是比较认同网络民意只是少数
    结论:p 没有统计学意义
    locoz
        15
    locoz  
       2022-12-11 03:12:23 +08:00
    然后就会有人莫名其妙出于找乐子之类的心态,对数据进行大量投毒,并主动或暗中观察或煽动说 xx 地方怎么怎么样,然后你的网站被封、人被请去喝茶。类似的事情又不是没有发生过,无法验证的“统计”数据除了被人利用以外没有任何实际价值。
    zxCoder
        16
    zxCoder  
       2022-12-11 08:40:24 +08:00
    @matthewgao "如果有效内容足够多" 这个很难实现的
    Track13
        17
    Track13  
       2022-12-11 09:39:06 +08:00 via Android
    我看你是想去美国申请政治庇护了。肯定会被刷。
    zhw2590582
        18
    zhw2590582  
       2022-12-11 09:51:55 +08:00
    你不怕有人写个脚本,疯狂地刷我阳了?
    zxCoder
        19
    zxCoder  
       2022-12-11 10:21:09 +08:00
    都不用扯什么政治的,你甚至可以试着在 v2 发个匿名投票,(看选"吃屎"的人多不多
    qinrui
        20
    qinrui  
       2022-12-11 11:01:12 +08:00
    @matthewgao 你莫不是对概率有什么误解
    tomari
        21
    tomari  
       2022-12-11 11:38:18 +08:00
    小心被当成境外势力抓起来
    luckykong
        22
    luckykong  
       2022-12-11 12:21:52 +08:00
    对于这类问题,经济学、管理学领域付出了极大极大的努力,想得到一个“有效内容足够多”的样本,但依然没有令人满意的结果。

    你这个方法,就像他们一样,只能拿到一个“包含有效内容”的样本。至于里面有效内容有多少、噪音比例多少、如何提取出来有效内容,都是无法解决的问题。
    你这个做法,第一个问题就是样本是不是随机抽样。你不用做,我都能猜到北上广深重阳了的人做多。三线城市没几个阳了的。 这个样本可信么?这完全受不同地方互联网发展程度的影响啊。
    sunwayTaihulight
        23
    sunwayTaihulight  
       2022-12-11 15:11:18 +08:00   ❤️ 1
    我有个想法:就是直接爬各地发热门诊的空余挂号数,观察是否富裕或挤兑。

    现今确诊数意义已经不大,但发热门诊的挂号量可以同时反映“病例数量级”、“病毒的毒力程度”、“医疗挤兑程度”。
    imldy
        24
    imldy  
       2022-12-11 15:13:21 +08:00   ❤️ 1
    calloc
        25
    calloc  
       2022-12-11 17:34:58 +08:00 via iPhone
    更新状态领红包
    20015jjw
        26
    20015jjw  
       2022-12-11 17:38:14 +08:00
    这不就是 down detector 吗
    7Sasuke7L
        27
    7Sasuke7L  
       2022-12-11 20:01:39 +08:00 via iPhone
    首先这个统计的实际价值不大,而且很多人并不知道你的网站,因此别人阳了,也不去你的网站专门点击一下。有人没有阳,也可以去点一下,最后得到的数据我实在不知道能干什么。数据的收集,准确性不能保证,也没什么用。
    Exdui
        28
    Exdui  
       2022-12-11 21:01:56 +08:00
    现在阳的人一般会在社交 APP 分享,从几大社交平台爬虫数据反而更靠谱一些。
    seansong
        29
    seansong  
       2022-12-12 14:21:04 +08:00
    制造焦虑并不是一个好的主意
    Youkochan0v0
        30
    Youkochan0v0  
       2022-12-12 21:58:51 +08:00
    这完全不靠谱啊,阳的人未必知道你的网站,知道你的网站的人也有办法一直刷数据
    iceteacover
        31
    iceteacover  
       2022-12-13 18:16:26 +08:00
    有些微博大 v 和 公众号在自己的粉丝中查看阳性比例,我看到过 2-3 个,比例都差不多 阴阳比 2 比 1 2022.12.12
    nmap
        32
    nmap  
       2022-12-13 20:41:20 +08:00
    属于国家机密了,只能官方公布,咋没点敏感性呢
    game159
        33
    game159  
       2022-12-14 13:23:54 +08:00
    我看刑,很有判头。
    uov
        34
    uov  
       2022-12-21 00:28:38 +08:00 via Android
    想吃捞饭
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5664 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 06:39 · PVG 14:39 · LAX 22:39 · JFK 01:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.