V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
tmkook
V2EX  ›  奇思妙想

抛硬币 1000 次其中正面 600 次反面 400 次,那么第 1001 次是正面的概率是 0.5?

  •  2
     
  •   tmkook · 2017-08-30 17:09:30 +08:00 · 13011 次点击
    这是一个创建于 2669 天前的主题,其中的信息可能已经有所发展或是发生改变。

    虽说硬币正反面的概率各 0.5,但是根据历史的 1000 次实验证明是不是正面的概率更大点?

    抛硬币的人力度掌握和硬币正反面微量的构造差异以及硬币掉落的地面是否会对 0.5 的概率产生影响呢?

    从这几方面考虑第 1001 次的正面概率是不是 0.6?

    第 1 条附言  ·  2017-08-31 11:01:43 +08:00
    一觉醒来这么多回复

    楼层中有提到贝叶斯其实就是看了贝叶斯后才有这个疑惑的

    很多地方说这个概率就是 0.5,但是从贝叶斯方法看他就不是 0.5

    大概理解了,这就是统计派和贝叶斯派的观点不同,具体问题具体分析不能一棒子打死。
    104 条回复    2017-09-04 02:05:07 +08:00
    1  2  
    hoythan
        1
    hoythan  
       2017-08-30 17:12:21 +08:00
    薛定谔的狗
    huijian222
        2
    huijian222  
       2017-08-30 17:13:18 +08:00
    是的 如果你认为的概率是以已知的实例来推导的话
    ioc
        3
    ioc  
       2017-08-30 17:13:19 +08:00 via Android
    0.5
    WuMingyu
        4
    WuMingyu  
       2017-08-30 17:17:21 +08:00 via iPhone
    我想到以前想过的问题,生了两个女孩,第三个孩子是女孩的概率是多少?按理是 0.5,但考虑所有生三个女孩的母亲在所有生过孩子的母亲里的比例,是不是小于 0.5 ?
    UnisandK
        5
    UnisandK  
       2017-08-30 17:18:29 +08:00
    如果前 1000 次样本算够大,能证明这是个两面概率 0.6:0.4 的不均匀硬币的话。。那应该是吧
    paradoxs
        6
    paradoxs  
       2017-08-30 17:19:54 +08:00   ❤️ 2
    doublleft
        7
    doublleft  
       2017-08-30 17:20:02 +08:00
    趋近 0.5
    honeycomb
        8
    honeycomb  
       2017-08-30 17:23:19 +08:00   ❤️ 3
    建议找一本概率论的书看一下,能比较系统地了解频率,概率,预期,估计的区别与关联。


    简单版本:
    “抛硬币 1000 次其中正面 600 次反面 400 次” --> 正面出现的频率是 600/1000


    "理想硬币在某一次抛中,出现正面的概率是 0.5"


    你对标题里的那个硬币正面出现的概率的估计为 0.6,该估计的方法为:

    “根据历史的 1000 次实验证明是不是正面的概率更大点?抛硬币的人力度掌握和硬币正反面微量的构造差异以及硬币掉落的地面是否会对 0.5 的概率产生影响呢?从这几方面考虑”
    jasontse
        9
    jasontse  
       2017-08-30 17:27:32 +08:00 via iPad   ❤️ 1
    抛硬币每次都是一半,不受历史影响。
    SENSIR
        10
    SENSIR  
       2017-08-30 17:29:21 +08:00 via Android
    @paradoxs #6 里面高赞回答
    简要而言你这个 1000 进 600 提供了额外的信息,所以不能仅考虑对半的“正常”几率
    whileFalse
        11
    whileFalse  
       2017-08-30 17:30:11 +08:00
    一般认为,硬币的正反面概率是 0.5。这是因为我们通常假设硬币是均匀圆柱体,高度很低;硬币抛起得足够高,硬币抛起动作足够随机;综合以上条件,我们 [认为] 单次抛硬币的概率是 0.5,以及多次抛硬币之间的结果不存在关联性。

    以上条件在通常理解的硬币题中均是不需要明确说明的隐含条件。当包含此隐含条件时,答案是 0.5。

    但落到一个现实问题时,可能硬币是不均匀的;抛硬币高度足够低,比如手放在桌子上,大拇指轻轻弹起硬币;抛起动作相对固定,且总是以正面朝上开始抛硬币;此时,上文说到的隐含条件就不起作用,则答案也就不相同了。
    blankme
        12
    blankme  
       2017-08-30 17:32:12 +08:00 via Android
    你第一句话和第二句话是互相矛盾的,其实你也不知道你在问什么。
    lightening
        13
    lightening  
       2017-08-30 17:32:54 +08:00
    @WuMingyu 那考虑到所有先生两个女孩又生一个男孩的母亲在所有生过孩子的母亲里的比例呢?
    yiwanGwan
        14
    yiwanGwan  
       2017-08-30 17:32:55 +08:00
    不管你要正面还是反面我一定能给你抛出
    lydasia
        15
    lydasia  
       2017-08-30 17:40:31 +08:00
    https://www.zhihu.com/question/29683794

    对于抛硬币来说,1000 次的样本容量不算太小了,如果跟 0.5 有较大差距,首先考虑的应该是别的因素,例如是不是硬币质地不均匀等等。
    northisland
        16
    northisland  
       2017-08-30 17:44:07 +08:00   ❤️ 6
    1000 次很大了,接近大数定理了


    可能这硬币一遍是毛爷爷,地狱是这个畜生的归宿 2333
    em84
        17
    em84  
       2017-08-30 17:58:59 +08:00
    没错,它就是 0.5,因为这是个独立事件,考虑到整个事件就不是这个概率了
    jason2017
        18
    jason2017  
       2017-08-30 18:04:41 +08:00
    关于概率的本质,其实现在学术界也没有一个定论。
    有兴趣可以了解下关键字:“决定论、量子物理”。
    lostvincent
        19
    lostvincent  
       2017-08-30 18:06:38 +08:00
    看给定条件了
    - 如果 0.5 的概率是给定的(既定事实),那后面的 600 : 400 只能说是个例样本,最后一个还是 0.5,即使前面抛了一万次,每次都是正面,下一次概率也还是 0.5
    - 如果 0.5 只是假想的,那么根据实验可以预估正面概率 0.6 左右,且这硬币可能并不均匀

    我猜你想要知道的可能是蒙提霍尔问题(三门问题),可以看下这个视频
    https://www.bilibili.com/video/av1248411
    简单易懂,而且蛮有趣的
    Macbooker
        20
    Macbooker  
       2017-08-30 18:08:23 +08:00 via iPhone
    @WuMingyu 建议重读高中数学
    Sanko
        21
    Sanko  
       2017-08-30 18:11:04 +08:00 via Android
    你这样大学概率论会拿不到分的
    ty89
        22
    ty89  
       2017-08-30 18:14:43 +08:00
    高中数学知识

    独立事件,互不影响
    Xs0ul
        23
    Xs0ul  
       2017-08-30 18:24:01 +08:00
    关键词:贝叶斯概率学派
    Macbooker
        24
    Macbooker  
       2017-08-30 18:28:33 +08:00 via iPhone
    如果你真的抛了一千次,那么这个硬币有毒。下一次的概率的确是 0.6。

    我们常说的 0.5 的硬币是指正常的均衡的安全无添加的硬币。
    Baymaxbowen
        25
    Baymaxbowen  
       2017-08-30 18:32:59 +08:00 via Android
    可能抛一千次以后你的手麻了,导致改变,但是一千次这个数目其实太小了,无论如何抛只能逼近 0.5
    lyz745704689
        26
    lyz745704689  
       2017-08-30 18:36:19 +08:00
    即时确定概率为 0.5,然后呢,还不只是一个概率嘛。。。
    qymobile
        27
    qymobile  
       2017-08-30 18:52:03 +08:00
    你这上过大学概率论么? 不对,这是初中数学级别啊
    15015613
        28
    15015613  
       2017-08-30 19:04:13 +08:00 via Android
    @WuMingyu #4
    @Macbooker
    “第三个孩子是女孩的概率是多少?按理是 0.5 ”,这个按理说就很有问题。
    如果说这个 0.5 是从全体新生儿出生性别比例得出来的。总体统计数据是不能随随便便推导应用到个体身上的。另外,新生儿性别比也不是 1:1,男性的比例要高一些,大概 104:100 的样子(应该没记错)。

    如果从医学的角度来说,也不能得出 0.5 的结论,XY 精子产生的数量,精子的活力有无差异,母体的免疫状况,有没有特殊的遗传缺陷等等诸多因素影响胎儿的性别。
    连续两胎都是女孩的夫妻,你很难说下一胎男女的概率一定是相等的。

    @lightening 说的统计方法或许可靠一些。
    kendisk
        29
    kendisk  
       2017-08-30 19:14:24 +08:00 via iPhone
    老家 有 前六个 都是 生女孩
    终于第七胎生了儿子
    然后 第八胎又是女儿
    zhangzhishanlo
        30
    zhangzhishanlo  
       2017-08-30 19:17:54 +08:00 via Android
    @Xs0ul 感觉就这个在理。
    Shura
        31
    Shura  
       2017-08-30 19:19:45 +08:00 via Android
    是的,因为是伯努利试验
    frankyzf
        32
    frankyzf  
       2017-08-30 19:29:40 +08:00 via Android
    买双色球可以选个没出过的号,几率大些
    imn1
        33
    imn1  
       2017-08-30 19:35:14 +08:00
    理论与现实
    概率论其实有个隐含条件,就是“所有研究样本除去要分析对比的部分,其他部分都是无差别的”
    就等于初中物理学“……阻力忽略不计……”,小学数学“……照这样计算……”

    所有理论用于实践,都要考虑误差范围
    lightening
        34
    lightening  
       2017-08-30 19:36:18 +08:00   ❤️ 2
    @15015613
    @WuMingyu
    其实是这样的,你要求的是一个条件概率。
    求:在一个妈妈已经生了两个女孩的情况下,再生一个女孩的概率。
    根据条件概率公式:一个妈妈连生三个女孩的概率 = (一个妈妈连生两个女孩的概率) * (在一个妈妈已经生了两个女孩的情况下,再生一个女孩的概率)

    因为你不知道(一个妈妈连生两个女孩的概率),你是无法通过(一个妈妈连生三个女孩的概率)求出(在一个妈妈已经生了两个女孩的情况下,再生一个女孩的概率。)的。


    如果假设生孩子的性别是独立事件(事实上不是,但是比较接近,我们取个简单的模型),且概率各为 0.5,那么第三个孩子是女孩的概率确实是 0.5 的。
    zakokun
        35
    zakokun  
       2017-08-30 19:37:55 +08:00   ❤️ 1
    理想状态是 0.5 ,但是结合现实来看就不一定了.
    比如生男生女,理论状态是 0.5,但是如果一个村里大部分人家生的都是女孩,完全合理推测这里的气候环境影响了 Y 染色体的活性这种情况导致生女孩的概率高
    投硬币的话,如果投了 1000 次有明显的概率差异,那可以推测这个硬币质量分布不均匀,导致一面出现的概率更高点儿
    prolic
        36
    prolic  
       2017-08-30 19:48:00 +08:00   ❤️ 1
    先验概率 0.5,观测数据 0.6,求最大后验概率
    coderdusk
        37
    coderdusk  
       2017-08-30 19:56:56 +08:00
    赌徒谬误
    https://zh.wikipedia.org/wiki/%E8%B3%AD%E5%BE%92%E8%AC%AC%E8%AA%A4

    赌徒谬误( The Gambler's Fallacy )亦称为蒙地卡罗谬误( The Monte Carlo Fallacy ),是一种概率谬误,主张由于某事发生了很多次,因此接下来不太可能发生;或者由于某事很久没发生,因此接下来很可能会发生。
    赌徒谬误的思维方式像是如此:抛一枚公平的硬币,连续出现越多次正面朝上,下次抛出正面的概率就越小,抛出反面的概率就越大。
    noli
        38
    noli  
       2017-08-30 21:03:33 +08:00 via iPhone
    这类问题的思维方式其实是这样的,要先澄清两个不同的概念,

    一是对未发生的某个事件将要发生的期望,

    二是已知某种概率分布求服从此分布的若干事件的概率。

    概念一的期望只与物理定律相关,与已统计的概率无关。

    概念二的期望是一种主观建模计算与客观实际统计的对比,由这种对比可以引申出如置信度等等的概念。

    所以,下一次的掷硬币实验结果是某一面的期望是 0.5。在此基础上,已知 1001 次掷硬币实验中,有 600 次正面,400 次背面,那么我们有理由相信第 1001 次的结果是背面的概率的概率比较高,否则我们应该相信这个实验存在某些问题导致期望与实验次数的相关函数不收敛于 0.5。
    ryd994
        39
    ryd994  
       2017-08-30 21:14:02 +08:00 via Android
    统计派和贝叶斯派
    yeeyeung
        40
    yeeyeung  
       2017-08-30 21:47:43 +08:00
    高中数学
    hst001
        41
    hst001  
       2017-08-30 22:11:08 +08:00
    港真,这个时候应该先怀疑硬币本身密度不均匀,所以在相同环境条件下,真有可能就是 0.6
    33Cat
        42
    33Cat  
       2017-08-30 22:51:45 +08:00 via Android
    600+∞∶400+∞=1,现在你觉得呢?
    cnnblike
        43
    cnnblike  
       2017-08-30 23:29:09 +08:00   ❤️ 1
    看信仰的问题——如果你信仰贝叶斯学派,那就是 6:4,如果信仰频率学派,那就是 1:1
    关键是什么?关键是你怎么看待之前的信息,你是否要采信 6:4 带来的信息呢?
    20015jjw
        44
    20015jjw  
       2017-08-31 00:42:15 +08:00 via Android
    学过统计的都知道这个问题啊...
    Domains
        45
    Domains  
       2017-08-31 00:46:37 +08:00
    概率只是能证明无限接近 50%,
    你这问题其实就是#37 赌徒谬误,
    澳门看到连续开了十几盘都是大,你要买小……
    WhoMercy
        46
    WhoMercy  
       2017-08-31 00:47:22 +08:00 via Android
    关键字:指数分布,无记忆性
    qq316107934
        47
    qq316107934  
       2017-08-31 00:48:33 +08:00 via Android
    @WuMingyu 两次生孩子互为独立事件,前后没有关联,一起看不科学
    misaka20038numbe
        48
    misaka20038numbe  
       2017-08-31 00:52:03 +08:00
    极端的例子,假如一枚硬币 1000 次都是正面,要么接下来提升出现反面的次数以达到正反概率平衡,要么这枚硬币的正反概率就不是 0.5,可能是 1。
    Taojun0714
        49
    Taojun0714  
       2017-08-31 03:02:40 +08:00   ❤️ 4
    但凡大学本科学过统计的,不是四年睡觉下来的,我相信看见这种水问题必定脱口而出:贝叶斯这三个字,以及频率派之争。而不是扯了半天用高中生语言在说一个条件概率这些入门东西。

    你们不妨统计下这个楼,说出贝叶斯三个字的占总楼数多少---不算我 48 楼竟然只出现三次,3/48 = 6.25%, 加上能说出大数定理几个字的,大概 10%不到吧。

    V2ex 的平均学历可想而知。
    233
        50
    233  
       2017-08-31 03:18:18 +08:00
    可以搜搜关键字「似然原理」,应该是当然资本宠儿「机器学习」的底层基础原理之一了吧
    t6attack
        51
    t6attack  
       2017-08-31 03:57:10 +08:00
    概率学背后的深层原理,是构成整个宇宙的根基之一,可以说是上帝级别问题。讨论起来很像玄学。
    想在帖子里把这个问题的原理搞清,是不可能的。

    至于题主的问题答案,就是 0.5,否则彩票就是可以预测的了。
    超低概率事件,单次测试,一定不会发生。但超大规模测试,一定会发生。
    你买彩票,不可能中头奖。但一亿人买彩票,一定会有人中头奖。就是这么神奇,就是这么无奈。
    t6attack
        52
    t6attack  
       2017-08-31 04:29:11 +08:00
    @Taojun0714 这反应的并不是平均学历,而是平均毕业时间。一个人能记住的书本知识,和毕业时间成反比。

    不许搜索,请回答:①倍角公式有哪些 ②等比数列求和公式 ③苯与浓硝酸发生硝化反应的方程式
    能回答上来,不能证明你学历高,只能证明你是个高中在读学生。
    答不上来,也并不能说明你没读过高中,也可以说明你已经毕业很久了。
    Xs0ul
        53
    Xs0ul  
       2017-08-31 04:31:16 +08:00
    @Taojun0714 #49 还有起手就是一个先验概率是多少多少,而不是先验分布
    Xs0ul
        54
    Xs0ul  
       2017-08-31 04:36:30 +08:00   ❤️ 2
    @t6attack #52 记住公式和记住概念是两码事,至少是知道有这样一个理论的存在。拿你的等比数列举例,你给没学过的人,他只能一个一个去加。但是学过的人,至少十几年内得知道有一个等比数列求和的公式存在吧?
    Taojun0714
        55
    Taojun0714  
       2017-08-31 04:41:00 +08:00
    @t6attack 你反问我的类比恰恰错了:想起贝叶斯跟你提的几个名词是对应的,我让你默写大数定理公式才对应你反问我的东西。我这个判断要求很低的。

    连最基础入门名词都想不起来,显然是根本没学过。而你,确实能想起来 “等比数列求和”这些词,说明你当然念过高中。给你的等比数列,你肯定能想起这个词。

    搞明白了?
    Taojun0714
        56
    Taojun0714  
       2017-08-31 04:43:39 +08:00
    @Xs0ul 正解,其实只要上过高中的看一眼 等比数列,必然会想起“等比数列”这四个汉字,而不需要你默写公式。跟看见这个问题就会想起 贝叶斯统计,先验后验这几个词一样容易,很低但很靠谱的判断依据。
    cnnblike
        57
    cnnblike  
       2017-08-31 05:28:33 +08:00
    @t6attack 倍角公式常用 sin2a=2sinacosa cos2a=1-2sina^2=2cosa^2-1 tan2a=2tana/(1-tana^2),剩下三个建议直接用推导出来的。
    等比求和(1-q^n)/(1-q)*a_1
    浓硝酸 14122,Cu+4HNO3=Cu(NO3)2+2NO+2H2O

    没搜索,研究生第二年,3*4=12 这种程度的东西还用搜的?
    msg7086
        58
    msg7086  
       2017-08-31 05:28:40 +08:00
    醒醒,我们说的是理想硬币,不是真硬币。
    一枚理想硬币是完美平衡的硬币,你裤兜里掏出来的硬币肯定不是理想硬币,因为正反面连图案和磨损都不同,这都会影响最终的概率。
    如果你抛 1000 次,正面 600 反面 400,那说明这枚硬币是一枚敏感词硬币,所以第 1001 次的概率也应该是 0.6 才对。
    msg7086
        59
    msg7086  
       2017-08-31 05:30:42 +08:00
    @Taojun0714
    @cnnblike
    州立小学毕业的给你们这些学霸丢脸了 _(:з」∠)_
    cnnblike
        60
    cnnblike  
       2017-08-31 05:32:47 +08:00
    @t6attack
    还“上帝级的问题”,惊了我去,贝叶斯学派都不懂,活在梦里
    cnnblike
        61
    cnnblike  
       2017-08-31 05:33:48 +08:00
    @msg7086 我靠记忆写的铜+浓硝酸,左右没配平,产物应该是 NO2,不是 NO
    Taojun0714
        62
    Taojun0714  
       2017-08-31 05:45:55 +08:00
    @msg7086 学而不思则罔,“思而不学则殆”。
    paulagent
        63
    paulagent  
       2017-08-31 05:58:39 +08:00
    我就觉得 V2 里民科越来越多了。 什么彩票号码过去 n 期没出现的,越有可能出现,你这真不是开玩笑吗?

    我觉得 @lightening 还有 @noli 讲的很好。 这个问题如果不懂就看概率论的书,想在论坛上讨论清楚是没可能的。 读书有点不理解,请去 courera 上有个台湾大学的华人教授讲授的概率论,讲的特别清晰
    cranelee13
        64
    cranelee13  
       2017-08-31 06:51:24 +08:00 via iPhone
    去学习贝叶斯吧,你会知道答案的。
    maninnet
        65
    maninnet  
       2017-08-31 06:52:51 +08:00 via Android
    不是独立随机事件吗?
    ebony0319
        66
    ebony0319  
       2017-08-31 07:39:09 +08:00 via Android
    贝叶斯定理。结果不是.05 ,因为已经在一个前提假设了。
    libook
        67
    libook  
       2017-08-31 08:01:07 +08:00
    0.5 只是理论上的理想硬币,如果你实验得出的是趋近于 0.6 的话,会不会因为这个硬币不是理想硬币?个人倾向于使用 0.6。
    mafeifan
        68
    mafeifan  
       2017-08-31 08:05:25 +08:00
    大学高数解释的很清楚,无聊的帖子
    xrui
        69
    xrui  
       2017-08-31 08:23:11 +08:00 via iPhone
    @t6attack 按您的说法,高中毕业以后是不是就记不住三角公式,不会配平方程式,不会求等比数列了?
    zhishidahao
        70
    zhishidahao  
       2017-08-31 08:30:27 +08:00
    多刷知乎,少刷 v2,←_←
    FollowHeart
        71
    FollowHeart  
       2017-08-31 08:31:36 +08:00
    @WuMingyu 这是互斥事件吧,不存在影响
    imn1
        72
    imn1  
       2017-08-31 08:33:54 +08:00   ❤️ 1
    结贴吧,这帖子看着累

    有 M 枚硬币,其中有一枚是次品,在足够多次的情况下,正反面抛出比为 6:4
    其余硬币为 1:1
    假设 M 枚硬币总体,在足够多次的情况下,正反面抛出比无限接近 1:1
    问 A:从 M 任意抽出一枚硬币后,拋一次硬币得到正面的概率?
    问 B:已知抽出此枚硬币后,拋一次硬币得到正面的概率?

    究竟 LZ 问的是 A 还是 B ?回答的究竟是 A 还是 B ?

    没搞清楚的话,争个鸟
    dianbuixao
        73
    dianbuixao  
       2017-08-31 09:01:56 +08:00 via Android
    @Taojun0714 嗯,我觉得你说的对\(^o^)/。我大学学了中医统计学的,但是没有接触过贝叶斯,可是 v2 上,像我这样有医学背景的少。如果那么多人,都没几个回答出来的,或者能说个随机独立事件的,v2 上面其实真实的学历并不高。这个问题好像是初中学的。
    wwwyiqiao
        74
    wwwyiqiao  
       2017-08-31 09:13:53 +08:00
    说的好像你买了 100 万次彩票都没中奖 100 万 01 次就会中奖一样
    hu8245
        75
    hu8245  
       2017-08-31 09:18:35 +08:00 via Android
    这也能引起这么多回复?不理解
    JasperYanky
        76
    JasperYanky  
       2017-08-31 09:27:02 +08:00
    高二的东西真的值得大家这么踊跃地回复? 工作量不饱和啊
    Macbooker
        77
    Macbooker  
       2017-08-31 10:02:19 +08:00
    @Taojun0714
    按你的思路走一遍。
    若:凡大学本科学过统计的,且不是四年睡觉下来的,必脱口而出“贝叶斯”。假定回复本帖的人从 V 站随机抽样而来(实际上不是)。
    已知:本帖回复贝叶斯的很少。
    可知:V 站大部分人本科没学过统计,或学过统计睡了四年。
    无法得出没上过本科的结论。
    tairan2006
        78
    tairan2006  
       2017-08-31 10:43:56 +08:00
    相对独立事件啊=,=
    boter
        79
    boter  
       2017-08-31 11:05:43 +08:00
    对不起,初中的公式都忘掉了
    浓硝酸,等比公式之类的确实记不起来,只记得 Cu 是铜。。。
    Haku
        80
    Haku  
       2017-08-31 11:14:06 +08:00
    数学问题里,需要有个“不考虑其他因素”,否则就是按照 0.6 考虑吧我猜
    arzterk
        81
    arzterk  
       2017-08-31 11:17:27 +08:00
    就算你扔 1000 次都是正面,下一次概率还是 1/2,除非你扔的硬币不正常
    holajamc
        82
    holajamc  
       2017-08-31 11:21:18 +08:00
    如果硬币正常的话,我选择相信马尔科夫…
    lusheldon
        83
    lusheldon  
       2017-08-31 11:32:17 +08:00 via Android
    @northisland 我真是震惊了,一个数学题都能勾起你对一个死去多年的人的咒骂。是非功过自有定论,但你这畜生这句话太过分了
    wzha2008
        84
    wzha2008  
       2017-08-31 11:44:38 +08:00
    频率派:最大思然估计,估计得正面概率是 0.6 的时候似然函数取最大了;
    贝叶斯派:贝叶斯估计,设定先验概率为 0.5,后面每投一次就用贝叶斯公式得到后验概率,直到 1000 次
    noNOno
        85
    noNOno  
       2017-08-31 12:00:52 +08:00
    每次投硬币都是独立事件
    UnknownR
        86
    UnknownR  
       2017-08-31 12:48:44 +08:00
    数学老师要被你气死了,概率只是对于时间可能性的度量,你扔 1000 次都是正面,第 1001 也是正面,但是对于扔硬币这件事的概率不会造成影响,每一次都是一次新事件,不是线性叠加
    em84
        87
    em84  
       2017-08-31 12:55:02 +08:00
    @Macbooker 我数学系的睡过了 4 年,贝叶斯我知道有这东西但还真不知道是做什么的,概率论与数理统计这本书说起来一点都不厚。另外我这大学虽说不是 211 但在本地找工作不要太简单
    loading
        88
    loading  
       2017-08-31 13:00:09 +08:00 via Android
    不是独立事件?
    Taojun0714
        89
    Taojun0714  
       2017-08-31 13:28:25 +08:00 via iPhone
    @Macbooker 哥们儿,概率与统计是大学本科几乎所有专业基础课啊……
    northisland
        90
    northisland  
       2017-08-31 13:29:11 +08:00   ❤️ 1
    @lusheldon 我也感觉我这个玩笑开过火了。
    其实我也不太恨他,主要是恨他有意建立的一系列体制,曾经并且仍旧在激发着大家人性中的恶。。。

    概率论里随机事件的含义是这样:很少几次事件,出现什么情况都是 RP ;但事件一多,就能显现出有规律性的东西。
    概率在大规模样本上展现的规律性,跟化学反应一样准。


    举个例子,当年,我们老家,康有为被红卫兵开坟戮尸。
    如果当时国内就出现这么一起事件,那么也许能归结到 RP 问题。

    但是当年,凡是能在古代称上圣人的,无论药圣、书圣、武圣,还是大成至圣,炎黄尧舜,岳王包公文丞相;他们的墓或庙或祠,都被毁了,不光对汉人,而且毁坏被藏民看做观音菩萨、弥勒佛的活佛遗迹遗骨,甚至关押其本人。

    这就可以称得上规律了。



    另外,假设楼主非得一口咬定,一面朝上的概率 p=0.5,就是 0.5 !
    那我们来算一下:
    试 1000 次实验,某一面朝上出现 600 次+,这个概率是多少~

    那出现的总次数,也是个随机变量,是 N(500, 15.81)一个高斯分布。~~(不懂的其实无所谓,,,,如果想搞明白去看 PRML 第 2 章,或者看这几个材料任意之一
    https://math.stackexchange.com/questions/1249602/width-of-gaussian-distribution-from-n-trials-of-coin-tossing
    https://www.physics.ohio-state.edu/~gan/teaching/spring04/Chapter3.pdf

    在 N(500, 15.81)得到数字 400-或 600+的概率,是

    ```
    from math import sqrt
    import scipy.stats

    p, N = 0.5, 1000
    mu = N*p
    sigma = sqrt(N*p*(1.-p))

    print(2*scipy.stats.norm(mu, 15.81).cdf(400))

    ```
    结论是:0.5 的硬币,你能抛出 600+或 400-的概率为 2.53e-10。
    所以说,楼主你非要一口咬定,单面朝上的 p 就是 0.5,有钓鱼嫌疑。 @tmkook
    Xs0ul
        91
    Xs0ul  
       2017-08-31 13:47:51 +08:00
    看了这么多回复,看的有点尴尬,我来写一段,希望能粗浅地解释一下频率学派和贝叶斯学派。

    这两个学派的核心区别在于,是否认为概率是一个确定的数值。频率学派的一个说法大家可能都听过,类似于概率是频率的极限,在这里就是扔硬币扔的足够多,概率很接近频率了,也就是 0.6。

    更高级一点的方法有极大似然法,就是设这个确定的扔正面的概率是θ,那扔出 600 正 400 反的概率就是θ^600 * (1-θ)^400。极大似然法希望求出一个θ,使得发生这样 600 正 400 反的概率最大。标准做法就是取对数以后求导,过程不详细写了,结论依然是 0.6。

    值得注意的是,以上过程完全不存在也不涉及“硬币正反面的概率各 0.5 ”这个假设或者前提。频率学派没法说,我按常理认为是 0.5,但是做了实验又觉得是 0.6 了,因为频率学派认为概率是一个完全确定的数值,定了 0.5 就改不了了。只有按照实验结果,得到是 0.6。

    因此就有了贝叶斯学派。贝叶斯学派认为,正面的概率本身不必是一个定值,也可以是一个分布。比如说,虽然正常的硬币是 0.5,但这个硬币是张三给我的,这家伙就喜欢恶作剧,我估计了一下,这个硬币有 50%的可能是普通硬币,也有 50%可能是个 0.6 的硬币。这称为先验分布,给出了一个具有不同可能性的假设。之前有人说先验概率是多少多少,其实是没有意义的。

    具体到计算,400 和 600 有点大算起来不方便,我就用扔一次和两次举个例子。假如第一次扔了正面,这个正面来自普通硬币的概率是 0.5*0.5,来自恶作剧硬币的概率是 0.5*0.6。很明显,直观看来,它更有可能是一个恶作剧硬币。具体计算,此时的概率分别是 0.25:0.3≈0.45:0.55 ,和我们直观相符。注意,此时结果仍然是一个分布,称为后验分布。

    假如我们再扔一次,扔出了反面,结果就变成了一正一反,直观来看,这样更可能是普通硬币了。计算上,概率分别是(0.5*0.5)*0.5:(0.5*0.6)*0.4≈0.51:0.49 。确实是更有可能是个普通硬币。

    之前提到,0.51:0.49 仍然是个分布,而不是具体给出了概率。还是依据直观,要给出一个概率的数值,可以选可能性最大的 0.51 对应的 0.5,这叫做最大后验概率。也还有其他选取数值的方法,不详细写了。

    所以,贝叶斯学派的结果,既依赖实验,也依赖先验的假设。按之前的假设,即使 1000 次中次次正面,我也只能说 0.6 和 0.5 比,0.6 更有可能,而不可能得出是 1。假如我的假设是正面概率是 0-1 的均匀分布,600 正 400 负的结果恰好就是 0.6,这也和直观相符,因为均匀分布基本相当于没有提供信息。

    有手滑打错的欢迎指出。希望有所帮助(
    northisland
        92
    northisland  
       2017-08-31 14:02:19 +08:00 via iPhone
    @Xs0ul 纠结频率学派贝叶斯派,跟纠结茴香豆的 6 种写法一样无聊,属于被某些中文教科书带进歧途了。
    都是 PRML 第一章的内容。一个叫 discriminative,一个叫 generative,都是必修课,解决问题互有短长。
    纯抠概念,深度学习是概率学派,但照样吊打贝叶斯门派的 MRF,CRF。
    Xs0ul
        93
    Xs0ul  
       2017-08-31 15:53:32 +08:00 via Android
    @northisland 1. 不要用 machine learning 的分类来分概率论的东西吧?这不等于有人在讨论说养猫好还是养狗好,你说别争了都是活的
    2. 我学的英文教材照样会提频率学派和贝叶斯学派的问题
    3. 深度学习也不就是概率学派,就你说的 CRF,搜搜看 CRF as RNN 吧,在 semantic segmentation 上可是有很好的结果的。
    Xs0ul
        94
    Xs0ul  
       2017-08-31 15:56:58 +08:00 via Android
    @northisland 另外单纯因为 2.53e-10 值小而否定结论可是不符合逻辑的。0.5 抛出 500/500 的概率照样是个超小的数。假设检验的问题,是另一个话题了。
    northisland
        95
    northisland  
       2017-08-31 16:12:19 +08:00 via iPhone   ❤️ 1
    @Xs0ul 分布的 cdf 是怎么定义的?🙈哈哈你别找我漏洞了,因为你把你自己知识漏洞暴露了,我说 cdf,你拿 pdf 反驳我😄

    0.5 抛出 500/500 的概率照样是个超小的数



    另外记住深度学习,无论 CNN 还是 RNN,还是 GANs,本质上都是 discriminative 方法。
    saran
        96
    saran  
       2017-08-31 16:17:36 +08:00
    一个问题,硬币正反两面其实并不是一致的对吧,正面的质量往往要比背面大些的吧。
    所以实际上抛硬币并非完全是 .5 而是下面 >.5 才对吧。
    saran
        97
    saran  
       2017-08-31 16:18:09 +08:00
    修改#96: >= .5
    northisland
        98
    northisland  
       2017-08-31 16:21:47 +08:00 via iPhone
    @Xs0ul 我只是单纯看不起贝叶斯学派说自己比概率学派高明。。。
    natforum
        99
    natforum  
       2017-08-31 16:34:33 +08:00
    不说了,先送你 5 个铜币吧
    Xs0ul
        100
    Xs0ul  
       2017-08-31 16:53:34 +08:00 via Android   ❤️ 1
    @northisland 94 楼的回复确实不对,感谢指出,我把你的 600+误认为 600 正面了,回头看了眼代码明白了。

    关于我提到的 CRF as RNN,我说的频率和贝叶斯的区别,和 discriminative 与 generative 无关,表达的是深度学习并不是只有概率学派。

    当然贝叶斯确实不比频率高明,因为在一些合适的假设下结果都是 0.6,频率的方法还更简洁一些。但是要解释怎么从 0.5 变成 0.6 的,确实是需要贝叶斯来解释的。

    和你交流挺有收获,感谢
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2757 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 03:34 · PVG 11:34 · LAX 19:34 · JFK 22:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.