一个与直觉相悖的概率问题引发的严肃思考

文章最后更新了我的理解,应该是没错了,而且讲得比较清楚了。
---------------------------------------------------
一个与直觉相悖的概率问题引发的严肃思考
http://www.guokr.com/article/517/
这是果壳死理性站去年发的一篇文章,当年LZ我还没学到贝叶斯(现在将要学)
第一堂课老师也是拿这个做了个例子。
我个人对13楼的算法表示还算认同,可是总是没有彻底明白。
按照文中算出的概率0.087,这样误检率是不是太高了呢?直觉(好吧,别吐槽)告诉我,检测的误检率不可能有0.913这么高吧?

那我问:某一个人去检测艾滋,(这里省去在人群中发病概率)我们采用的是某种血液试验检测法用于检测身体中是否含有艾滋病病毒,这种方法相当精确,但也可能带来两种误诊。首先,他可能会让某些真有艾滋病的人得到阴性结果,称为假阴性,不过只有0.05的概率发生;其次,它还可能让某些没有艾滋病的人得到阳性结果,称为假阳性,不过只有0.01的概率会发生。

那这个人检出阳性而且患病的概率是多少呢?99%?

开始的问题:但是为什么加了个发病率概率就变了呢?对于单个个体,单检测一个人的时候误诊概率只有1%,检测了1000人的时候误诊概率就达到了0.913?检测1000个人对单个个体的误诊率不影响吧?

当年我是这么算的:
一个人去检验,只有两个可能:
1他患病 2他没患病
当他患病时,检出为阳性的概率为0.95
当他不患病时,检出阳性的概率为0.01
那么他检出为阳性而且患病时,概率为0.95/0.96

而楼主是这么算的:
一个人去检验,只有两个可能:
1他患病 2他没患病
当他患病时,(人群中患病概率为0.001)检出为阳性的概率为0.95
当他不患病时,(概率为0.999)检出阳性的概率为0.01
那么他检出为阳性而且又患病时,概率为
0.001*0.95/(0.001*0.95+0.999*0.01)=0.087

所以我觉得是在要不要用上“人群中患病概率”这里有分歧。
我觉得既然他本来就是去测患没患病的,那就应该不算这个“人群中患病概率”。
他患病不患病跟“人群中患病概率”可以等价吗?那这样说,每个人患艾滋的概率是0.001?
如果是等价的,那我开始的问题怎么解释呢?

(讨论的时候请假设这个人是无缘无故的去做检测的正常人,不是基友,不是性工作者)
---------------------------------------------------------
我的理解:
文章中讲的是【大规模检测】的误诊率(没病却阳性),这确实可以很高,甚至有99.5%,见:
http://www.lw23.com/pdf_D774D32E-64CC-4F48-BCF2-58416B487C6D/lunwen.pdf
而现实生活中去检测的人【对单个个体进行检测】,患病概率不可能为0.1%,要高很多,所以不能用0.1%去算。假设用80%去算,这样算出来的误诊率就与直觉不相悖了。
另外,我们还要复试,复试用的方法更好,误诊率更低,所以最终误诊率会小于0.1%,与直觉不相悖。
-------------------------------------------------------------
我觉得这样就很明白了,至少我是完全懂了

评论 (40) 只看楼主

全部评论

  • 1楼
    2012-01-12 18:50 幺哥 只看Ta

    关键是医生说那个0.01的人为假阳性要正确理解

    很明显这里应该是指去检查的人得到阳性结果的人里面

    否则0.05的人为假阴性,那么岂不是说所有人里面有0.05以上都有艾滋病?远高于0.001了

    实际上这个地方那哥们的确诊率已经说了,就是0.99

    用什么贝叶斯完全是把简单问题搞复杂

    [1] |
  • 2楼
    2012-01-12 19:02 driversetc 只看Ta

    概率话题要火……

    [1] |
  • 3楼
    2012-01-12 19:37 炝炒空心菜 只看Ta

    我就是觉得在计算一个人检测是否患病的概率中,考虑人群概率,很可疑

    [0] |
  • 4楼
    2012-01-13 07:11 lsydd 只看Ta

    我个人理解 因为没患病的人很多 所以误检为 病人的几率虽然小 但人数比真的病人多很多 所以误检的概率很大

    [0] |
  • 5楼
    2012-01-13 07:15 lsydd 只看Ta

    而这道题与直觉的分叉在于 正常人很少去医院检测艾滋病 你把他当纯粹的概率问题是不正确的 因此 实际情况应该 误检远小于理论值

    [0] |
  • 6楼
    2012-01-13 07:24 lsydd 只看Ta

    而 似乎对于 0.01的理解也有问题 应该是 测出艾滋病的人 有百分之一 而不是 测了就有百分之一 误测 而如果按这种正确理解 这道题误测几率就是百分之一

    [0] |
  • 7楼
    2012-01-13 07:26 lsydd 只看Ta

    同一种阐述 两种理解方式 的结果大大不同 就类似于三门问题吧

    [0] |
  • 8楼
    2012-01-13 07:29 jiangxj 只看Ta

    关健错误是发病率。因为去检查的人已经不是普通人,是可能性很高的人。

    [0] |
  • 9楼
    2012-01-13 08:06 jiangxj 只看Ta

    用同样的方法计算监狱中的杀人犯,所有的杀人犯都得释放了!

    [0] |
  • 10楼
    2012-01-13 08:24 jiangxj 只看Ta

    大学生变成书呆子,教育的悲剧!

    [0] |
  • 11楼
    2012-01-13 08:38 lsydd 只看Ta

    真会上纲上线

    [0] |
  • 12楼
    2012-01-13 10:34 都是_扯谈 电子工程专业 只看Ta
    引用@jiangxj 的回应:关健错误是发病率。因为去检查的人已经不是普通人,是可能性很高的人。

    你没有看我最后一句话。而且你扯什么杀人犯,扯什么书呆子?麻烦大神你放低你的姿态行吗?

    [0] |
  • 13楼
    2012-01-13 11:58 轩辕少年 只看Ta
    引用@幺哥 的回应:关键是医生说那个0.01的人为假阳性要正确理解

    很明显这里应该是指去检查的人得到阳性结果的人里面

    否则0.05的人为假阴性,那么岂不是说所有人里面有0.05以上都有艾滋病?远高于0.001了

    实际上这个地方那哥们的确诊率已经说了,就是0.99

    用什么贝叶斯完全是把简单问题搞复杂

    解释的完全正确
    本应该是:正常人呈阳性被误诊的概率
    本题扭曲为:正常人被误诊的概率
    这题完全没意义,就算按正确的算法,得出的也会是99%
    绕了个圈子

    [0] |
  • 14楼
    2012-01-13 13:11 Maigo-_- 语言爱好者 只看Ta

    楼主要分清联合概率和条件概率。楼主说的“检出阳性而且患病的概率”是一个联合概率:
    P(阳性且患病) = P(患病) * P(阳性|患病)
    所以需要知道人群中的发病率(即P(患病))。楼主强调了这是个普通人,所以人群的发病率可以应用到他身上。

    这个问题中,“与直觉相悖”的是对于普通人来说,即使检验呈阳性,患病的概率仍然很小。这涉及的是这样一个条件概率:P(患病|阳性)。由贝叶斯公式,它等于

    P(患病|阳性) = P(患病) * P(阳性|患病) / (P(患病) * P(阳性|患病) + P(健康) * P(阳性|健康))

    这个概率由分母中相加的两项的相对大小决定。一般情况下,P(阳性|患病)和P(健康)均接近1。当P(阳性|健康)(即假阳性发生率)大于P(患病)(即人群中的患病率)时,P(患病|阳性)就会很小,产生“有悖直觉”的结果。

    其实,就算使用直觉,只要多想一步就可以理解。检测结果为阳性可能有两种可能:一种是这个人真的患病了,另一种是假阳性。如果假阳性的发生概率大于人的发病率,那我们就会更倾向于相信这是假阳性。

    [1] |
  • 15楼
    2012-01-13 13:30 fanmit 只看Ta

    呵呵,这是基本的筛查概率问题,恰好偶替人写过涉及筛查统计的论文,可以小小解释一下。
    筛查方法的评判(classification)指标主要有2个:
    一个是敏感性(Sensitivity),表明实际阳性样本中测得阳性结果的可能性。
    一个是特异性(Specificity),表明测得阴性结果中实际阴性样本所占比例。
    我们定义一些符号(单位都是“例”):
    Rp:实际阳性且测试阳性
    Fp:实际阴性但测试阳性
    Rn:实际阴性且测试阴性
    Fn:实际阳性且测试阴性
    Pp:实际阳性率
    那么
    样本总数S:Rp+Fp+Rn+Fn
    敏感性Ps:Rp/(Rp+Fn)(其中Rp+Fn必定足够接近SPp,否则样本就有问题)
    特异性Pc:Rn/(Rn+Fp)(其中Rn+Fp必定足够接近S(1-Pp),否则样本就有问题)
    使用不同的判断阈值就能得到不同的敏感性和特异性值对,这些数据对就能画出ROC图(参考http://baike.baidu.com/view/42249.htm),可见一般情况下,两者是负相关的。
    基本概念就是这些。
    现在已知Pp=0.001,Ps=0.95,Pc=0.99,求Rp/(Rp+Fp)
    初中难度的计算啦:
    Rp=0.00095S,Fn=0.00005S,Rn=0.98901S,Fp=0.00999S
    Rp/(Rp+Fp)=0.0868
    可见在小概率事件时,阳性结果的真概率受特异性影响极大,而由于特异性与敏感性之间的负相关,使得提高特异性代价上升极快,即假阴性比例迅速上升。所以一般都是用简便廉价但敏感性好的方法筛查,提高结果阳性样本中真阳性的比例(浓缩),然后用特异性好但昂贵的方法来证实。本例中就将原本0.001的阳性概率提高到了0.0868,80几倍相当好了。
    实际研究时,由于实验经费、期限等限制,一般不能用很大的样本,,导致研究小概率事件时阳性样本不足,此时通常采用有偏的样本选择,即在阴性样本中仅随机抽取与阳性样本数相同或一定比例的数量。在实验结束后用最大似然法拟合模型的参量,此时可针对实际概率进行校正。

    [0] |
  • 16楼
    2012-01-13 14:18 都是_扯谈 电子工程专业 只看Ta
    引用@轩辕少年 的回应:
    解释的完全正确
    本应该是:正常人呈阳性被误诊的概率
    本题扭曲为:正常人被误诊的概率
    这题完全没意义,就算按正确的算法,得出的也会是99%
    绕了个圈子

    正常人呈阳性被误诊的概率
    不就等于
    正常人被误诊的概率
    吗?
    正常人就是=不患病
    被误诊就是=呈阳性
    那这两句话没区别了

    [0] |
  • 17楼
    2012-01-13 14:21 都是_扯谈 电子工程专业 只看Ta
    引用@Maigo 的回应:楼主要分清联合概率和条件概率。楼主说的“检出阳性而且患病的概率”是一个联合概率:
    P(阳性且患病) = P(患病) * P(阳性|患病)
    所以需要知道人群中的发病率(即P(患病))。楼主强调了这是个普通人,所以人群的发病率可以应用到他身上。

    这个问题中,“与直觉相悖”的是对于普通人来说,即使检验呈阳性,患病的概率仍然很小。这涉及的是这样一个条件概率:P(患病|阳性)。由贝叶斯公式,它等于

    P(患病|阳性) = P(患病) * P(阳性|患病) / (P(患病) * P(阳性|患病) + P(健康) * P(阳性|健康))

    这个概率由分母中相加的两项的相对大小决定。一般情况下,P(阳性|患病)和P(健康)均接近1。当P(阳性|健康)(即假阳性发生率)大于P(患病)(即人群中的患病率)时,P(患病|阳性)就会很小,产生“有悖直觉”的结果。

    其实,就算使用直觉,只要多想一步就可以理解。检测结果为阳性可能有两种可能:一种是这个人真的患病了,另一种是假阳性。如果假阳性的发生概率大于人的发病率,那我们就会更倾向于相信这是假阳性。

    可是要求的就是这个人患病的概率,那为什么还要假定一个“患病概率”呢?
    那你的意思是不是就是说其实艾滋病的误诊率很高?达到90%?

    [0] |
  • 18楼
    2012-01-13 14:23 jiangxj 只看Ta
    引用@都是扯谈 的回应:你没有看我最后一句话。而且你扯什么杀人犯,扯什么书呆子?麻烦大神你放低你的姿态行吗?

    首先我为"书呆子"三字向大家道歉。
    其实这三个字并没有指你。
    我只是为这么多人为了这个明显的错误还要争个不休感到不解。
    杀人犯问题是可以算一算的,是同样的例子。
    杀人犯的概率比“艾”病的概率小得多,如果用同样的公式算一定会得出荒唐的结果,即所有杀人犯真的杀人的概率极低(个个都是误判)。
    不信请算一算。
    错误的原因我已经说了,是样本的概率取错了,应取样本对象(即会去检查的人)的得病率,而不是所有人的得病率。
    如果取样对象是普通人,那么这种算法是正确的,问题是取样对象不是普通人,怎么能用普通人的得病率呢?

    [0] |
  • 19楼
    2012-01-13 14:29 都是_扯谈 电子工程专业 只看Ta
    引用@fanmit 的回应:呵呵,这是基本的筛查概率问题,恰好偶替人写过涉及筛查统计的论文,可以小小解释一下。
    筛查方法的评判(classification)指标主要有2个:
    一个是敏感性(Sensitivity),表明实际阳性样本中测得阳性结果的可能性。
    一个是特异性(Specificity),表明测得阴性结果中实际阴性样本所占比例。
    我们定义一些符号(单位都是“例”):
    Rp:实际阳性且测试阳性
    Fp:实际阴性但测试阳性
    Rn:实际阴性且测试阴性
    Fn:实际阳性且测试阴性
    Pp:实际阳性率
    那么
    样本总数S:Rp+Fp+Rn+Fn
    敏感性Ps:Rp/(Rp+Fn)(其中Rp+Fn必定足够接近SPp,否则样本就有问题)
    特异性Pc:Rn/(Rn+Fp)(其中Rn+Fp必定足够接近S(1-Pp),否则样本就有问题)
    使用不同的判断阈值就能得到不同的敏感性和特异性值对,这些数据对就能画出ROC图(参考http://baike.baidu.com/view/42249.htm),可见一般情况下,两者是负相关的。
    基本概念就是这些。
    现在已知Pp=0.001,Ps=0.95,Pc=0.99,求Rp/(Rp+Fp)
    初中难度的计算啦:
    Rp=0.00095S,Fn=0.00005S,Rn=0.98901S,Fp=0.00999S
    Rp/(Rp+Fp)=0.0868
    可见在小概率事件时,阳性结果的真概率受特异性影响极大,而由于特异性与敏感性之间的负相关,使得提高特异性代价上升极快,即假阴性比例迅速上升。所以一般都是用简便廉价但敏感性好的方法筛查,提高结果阳性样本中真阳性的比例(浓缩),然后用特异性好但昂贵的方法来证实。本例中就将原本0.001的阳性概率提高到了0.0868,80几倍相当好了。
    实际研究时,由于实验经费、期限等限制,一般不能用很大的样本,,导致研究小概率事件时阳性样本不足,此时通常采用有偏的样本选择,即在阴性样本中仅随机抽取与阳性样本数相同或一定比例的数量。在实验结束后用最大似然法拟合模型的参量,此时可针对实际概率进行校正。

    有点长,但是用你说的来算其实就是跟那个叶贝斯的式子一样的。
    我就想问一个问题,如果一个普通人(比如说你)去检测呈阳性的话,那么误诊率是90%多?

    [0] |
  • 20楼
    2012-01-13 14:35 都是_扯谈 电子工程专业 只看Ta
    引用@jiangxj 的回应:
    首先我为"书呆子"三字向大家道歉。
    其实这三个字并没有指你。
    我只是为这么多人为了这个明显的错误还要争个不休感到不解。
    杀人犯问题是可以算一算的,是同样的例子。
    杀人犯的概率比“艾”病的概率小得多,如果用同样的公式算一定会得出荒唐的结果,即所有杀人犯真的杀人的概率极低(个个都是误判)。
    不信请算一算。
    错误的原因我已经说了,是样本的概率取错了,应取样本对象(即会去检查的人)的得病率,而不是所有人的得病率。
    如果取样对象是普通人,那么这种算法是正确的,问题是取样对象不是普通人,怎么能用普通人的得病率呢?

    你这样说就清楚多了。我也懂了。依你的意思,原文所说的题的算法是错的?可是为什么是错的,又拿来当例子这么久呢?

    [0] |
  • 21楼
    2012-01-13 15:15 fanmit 只看Ta
    引用@都是扯谈 的回应:
    有点长,但是用你说的来算其实就是跟那个叶贝斯的式子一样的。
    我就想问一个问题,如果一个普通人(比如说你)去检测呈阳性的话,那么误诊率是90%多?

    没错。所以说与直觉相悖。HIV筛查是这种现象的经典例子,联合国报告里估计中国65万,算下来也就千分之0.5,筛查的敏感和特异性都是0.999,此时阳性结果的真概率也就0.334,即筛查阳性的误诊率还是有66.6%。

    [0] |
  • 22楼
    2012-01-13 15:26 轩辕少年 只看Ta
    引用@都是扯谈 的回应:
    正常人呈阳性被误诊的概率
    不就等于
    正常人被误诊的概率
    吗?
    正常人就是=不患病
    被误诊就是=呈阳性
    那这两句话没区别了

    全意是 正常人×呈阳性的比例×误诊率
    本题是 正常人×误诊率
    呈阳性包括病人和误诊
    呈阳性的比例则是 病人和误诊的总和/总检测人数

    [0] |
  • 23楼
    2012-01-13 15:50 轩辕少年 只看Ta
    @都是扯谈

    只看你如何理解那1%
    是 误诊数/总检测数
    还是 误诊数/总呈阳性数(病人和误诊的总数)

    [0] |
  • 24楼
    2012-01-13 15:56 ping0fdeath 只看Ta

    我还想关心另一个问题:无论是条件概率还是联合概率,都是说的一个群体的事情,悲剧哥现在不关心其他人,只关心自己。那么在自己身上,那个“单检测一个人的时候误诊概率只有1%”就是他的全部关注点了。
    对于个体来说,群体性的概率计算是没有意义的吧?

    [0] |
  • 25楼
    2012-01-13 16:13 jiangxj 只看Ta
    引用@都是扯谈 的回应:
    你这样说就清楚多了。我也懂了。依你的意思,原文所说的题的算法是错的?可是为什么是错的,又拿来当例子这么久呢?

    这就是可气的地方了!如果这种算法是普通人或年青大学生拿出来的,大家笑笑也就算了。而这种算法往往是高级知识分子、或概率学老师(确实有位高校概率学教师,教授级是这样算的)拿出来的。所以我说是教育的悲剧。

    [0] |
  • 26楼
    2012-01-13 18:59 都是_扯谈 电子工程专业 只看Ta
    引用@轩辕少年 的回应:
    只看你如何理解那1%
    是 误诊数/总检测数
    还是 误诊数/总呈阳性数(病人和误诊的总数)

    按照那篇文章的理解,是没病的人中检测得到阳性的概率,也就是 误诊数/(总检测数-有病的人数)

    [0] |
  • 27楼
    2012-01-13 19:09 都是_扯谈 电子工程专业 只看Ta
    引用@fanmit 的回应:
    没错。所以说与直觉相悖。HIV筛查是这种现象的经典例子,联合国报告里估计中国65万,算下来也就千分之0.5,筛查的敏感和特异性都是0.999,此时阳性结果的真概率也就0.334,即筛查阳性的误诊率还是有66.6%。

    我专门google了一下,砖家表示误诊率为0.1%,虽然题目的条件只是假设的,不能跟实际来比。
    但是这个误诊率又是怎么来的呢?而且如18楼所说,那监狱里关的不大部分都是好人?
    http://www.120.net/zhuanjiaguandian/1519994/12563.html
    http://testcardsale.bokee.com/4448483.html

    [0] |
  • 28楼
    2012-01-14 01:33 Maigo-_- 语言爱好者 只看Ta
    引用@都是扯谈 的回应:
    可是要求的就是这个人患病的概率,那为什么还要假定一个“患病概率”呢?
    那你的意思是不是就是说其实艾滋病的误诊率很高?达到90%?


    lz还是没分清要求的到底是什么概率:
    检出阳性而且患病的概率 -> 联合概率P(阳性且患病) = P(患病) * P(阳性|患病)
    在检出阳性的条件下患病的概率 -> 条件概率P(患病|阳性)
    (不知道检查结果时)患病的概率,即人群中的发病率 -> P(患病)

    在假阳性概率大于发病率的时候,确实误诊的概率很高。但由于假阳性概率本身依然很小,所以实践中采用“复查”的方法,两次都是假阳性的概率就很低了。

    [0] |
  • 29楼
    2012-01-14 10:06 fanmit 只看Ta
    引用@都是扯谈 的回应:
    我专门google了一下,砖家表示误诊率为0.1%,虽然题目的条件只是假设的,不能跟实际来比。
    但是这个误诊率又是怎么来的呢?而且如18楼所说,那监狱里关的不大部分都是好人?

    文章要看全。
    另外,ELISA测试呈阳性的患者还要再经过更加复杂更加精确也更加昂贵的西方点测确认,才会被最终确诊。结果是现在误诊率已经降到了千分之一以下。
    这是两次测量的结果,第一次用便宜的,目的是浓缩样本的阳性比例,然后用贵的,目的是排除误诊。两个联合后才能达到假阳性在阳性结果中的“千分之一以下”。那个例子里说的是第一次筛查时阳性结果的实际阳性可能。

    [0] |
  • 30楼
    2012-01-14 16:00 Ekoms 数学/化学爱好者 只看Ta

    看了那么多,我还是忍不住要吐槽了……

    首先统计学上有分第一类错误和第二类错误,在这里检查一个人有没有病,比如取这人有病为零假设进行验证:
    如果病人有病,但检查结果说这人没病,称为第一类错误;
    反之,如果病人没病,但检查结果说这人有病,称为第二类错误。
    也就是“假阳性”和“假阴性”的说法。
    任何一种检查手段,两类错误的概率是不一样的,所以“误诊率”本身的说法很奇怪。举个例子,通过超声波成像观察胎儿性别,看到JJ的当然是男孩。不妨取零假设为胎儿是男孩。如果观察的时候胎儿位置不配合可能会看不到那个部分,这样男孩可能会被当成女孩,是第一类错误;也可能其他原因造成的一个阴影被当成是jj,这样女孩可能会被当成是男孩。实际操作中看到女孩结果生出来是男孩的案例远多于看到是男孩结果生出来是女孩的案例。

    然后一般检测呈阳性的话会进行各种复查以排除假阳性的可能。

    ==============以上是与本题无关的吐槽==================

    杀人犯的问题:
    一个人是杀人犯的概率当然很低,所以要严格取证,保护嫌疑人的利益。多项证据都指证同一个人有嫌疑,那当然这个人有罪的可能性就大大高于一个无关的路人。
    反过来一个人去医院检查可以有很多原因的,比如例行体检,没有理由说这个人患病的几率一定高于整个人群的平均水平。

    ========================
    关于本题,我觉得14楼和15楼的回答已经很到位了,如果你是想认真搞懂这个问题,建议想办法看懂他们在说什么,因为概率学有自己一套严谨的术语体系,跟生活用语有出入。
    然后跟直觉相反又怎样了呢?直觉不对也没什么问题吧。。。直觉还觉得地球是平的呢。。

    [0] |
  • 31楼
    2012-01-14 16:09 都是_扯谈 电子工程专业 只看Ta
    引用@fanmit 的回应:
    文章要看全。
    另外,ELISA测试呈阳性的患者还要再经过更加复杂更加精确也更加昂贵的西方点测确认,才会被最终确诊。结果是现在误诊率已经降到了千分之一以下。
    这是两次测量的结果,第一次用便宜的,目的是浓缩样本的阳性比例,然后用贵的,目的是排除误诊。两个联合后才能达到假阳性在阳性结果中的“千分之一以下”。那个例子里说的是第一次筛查时阳性结果的实际阳性可能。

    恩,说的是,找到了一篇文章
    http://www.lw23.com/pdf_D774D32E-64CC-4F48-BCF2-58416B487C6D/lunwen.pdf

    [0] |
  • 32楼
    2012-01-14 16:23 都是_扯谈 电子工程专业 只看Ta
    引用@Ekoms 的回应:看了那么多,我还是忍不住要吐槽了……

    首先统计学上有分第一类错误和第二类错误,在这里检查一个人有没有病,比如取这人有病为零假设进行验证:
    如果病人有病,但检查结果说这人没病,称为第一类错误;
    反之,如果病人没病,但检查结果说这人有病,称为第二类错误。
    也就是“假阳性”和“假阴性”的说法。
    任何一种检查手段,两类错误的概率是不一样的,所以“误诊率”本身的说法很奇怪。举个例子,通过超声波成像观察胎儿性别,看到JJ的当然是男孩。不妨取零假设为胎儿是男孩。如果观察的时候胎儿位置不配合可能会看不到那个部分,这样男孩可能会被当成女孩,是第一类错误;也可能其他原因造成的一个阴影被当成是jj,这样女孩可能会被当成是男孩。实际操作中看到女孩结果生出来是男孩的案例远多于看到是男孩结果生出来是女孩的案例。

    然后一般检测呈阳性的话会进行各种复查以排除假阳性的可能。

    ==============以上是与本题无关的吐槽==================

    杀人犯的问题:
    一个人是杀人犯的概率当然很低,所以要严格取证,保护嫌疑人的利益。多项证据都指证同一个人有嫌疑,那当然这个人有罪的可能性就大大高于一个无关的路人。
    反过来一个人去医院检查可以有很多原因的,比如例行体检,没有理由说这个人患病的几率一定高于整个人群的平均水平。

    ========================
    关于本题,我觉得14楼和15楼的回答已经很到位了,如果你是想认真搞懂这个问题,建议想办法看懂他们在说什么,因为概率学有自己一套严谨的术语体系,跟生活用语有出入。
    然后跟直觉相反又怎样了呢?直觉不对也没什么问题吧。。。直觉还觉得地球是平的呢。。

    额,误诊率是有点用的不是地方,但是在这里是指没病却阳性。我又在网上找了文章,最终应该是懂了。其实我觉得14,15楼确实比较专业些,但还不如原帖13楼那个通俗易懂。
    只是我没想到过有初筛和再检测两个环节,所以造成了一点误解。我在帖子里有更新,那个理解应该没错了

    [0] |
  • 33楼
    2012-01-14 18:41 七彩琉璃2010 只看Ta

    这两个概率所指的样本不一致(一个是全球所有人,一个是实验参于者),怎么被贝叶斯起来的,莫名奇妙。

    [0] |
  • 34楼
    2012-01-14 18:45 七彩琉璃2010 只看Ta
    引用@七彩琉璃2010 的回应:这两个概率所指的样本不一致(一个是全球所有人,一个是实验参于者),怎么被贝叶斯起来的,莫名奇妙。

    说错了,是‘总体’不一致。

    [0] |
  • 35楼
    2012-01-15 09:16 jiangxj 只看Ta
    引用@Ekoms 的回应:看了那么多,我还是忍不住要吐槽了……

    首先统计学上有分第一类错误和第二类错误,在这里检查一个人有没有病,比如取这人有病为零假设进行验证:
    如果病人有病,但检查结果说这人没病,称为第一类错误;
    反之,如果病人没病,但检查结果说这人有病,称为第二类错误。
    也就是“假阳性”和“假阴性”的说法。
    任何一种检查手段,两类错误的概率是不一样的,所以“误诊率”本身的说法很奇怪。举个例子,通过超声波成像观察胎儿性别,看到JJ的当然是男孩。不妨取零假设为胎儿是男孩。如果观察的时候胎儿位置不配合可能会看不到那个部分,这样男孩可能会被当成女孩,是第一类错误;也可能其他原因造成的一个阴影被当成是jj,这样女孩可能会被当成是男孩。实际操作中看到女孩结果生出来是男孩的案例远多于看到是男孩结果生出来是女孩的案例。

    然后一般检测呈阳性的话会进行各种复查以排除假阳性的可能。

    ==============以上是与本题无关的吐槽==================

    杀人犯的问题:
    一个人是杀人犯的概率当然很低,所以要严格取证,保护嫌疑人的利益。多项证据都指证同一个人有嫌疑,那当然这个人有罪的可能性就大大高于一个无关的路人。
    反过来一个人去医院检查可以有很多原因的,比如例行体检,没有理由说这个人患病的几率一定高于整个人群的平均水平。

    ========================
    关于本题,我觉得14楼和15楼的回答已经很到位了,如果你是想认真搞懂这个问题,建议想办法看懂他们在说什么,因为概率学有自己一套严谨的术语体系,跟生活用语有出入。
    然后跟直觉相反又怎样了呢?直觉不对也没什么问题吧。。。直觉还觉得地球是平的呢。。

    你错了!
    你自己也知道你错在哪!
    你有意识的用“例行体检”替换了“某一个人去检测艾滋”
    “例行体检”是每个人都会发生的事件,取整体概率是正确的。
    “某一个人去检测艾滋”并不是普通人会发生的事件,不能取整体概率!
    把人分为二类,一类是可能得了艾滋的,一类是不可能已得艾滋的,我想可能已得艾滋的比例很小可能只占总体的1/10,而“某一个人去检测艾滋”这“某一个人”应该是这1/10中已经出现某种症状的人,这种人是1/10中的少数,这种群体的概率远远不是普通人的概率,他们得“艾滋”的概率可能是10%,这个10%才是公式中就取的发病率。

    [0] |
  • 36楼
    2012-01-15 13:52 都是_扯谈 电子工程专业 只看Ta
    引用@jiangxj 的回应:
    你错了!
    你自己也知道你错在哪!
    你有意识的用“例行体检”替换了“某一个人去检测艾滋”
    “例行体检”是每个人都会发生的事件,取整体概率是正确的。
    “某一个人去检测艾滋”并不是普通人会发生的事件,不能取整体概率!
    把人分为二类,一类是可能得了艾滋的,一类是不可能已得艾滋的,我想可能已得艾滋的比例很小可能只占总体的1/10,而“某一个人去检测艾滋”这“某一个人”应该是这1/10中已经出现某种症状的人,这种人是1/10中的少数,这种群体的概率远远不是普通人的概率,他们得“艾滋”的概率可能是10%,这个10%才是公式中就取的发病率。

    我再次看了下原题,原题并没有说明,所以你这种理解也没错,或者说应该更正确些。不同的理解产生了不同的答案,也不能说谁对谁错。我在31楼贴了个链接。我觉得原帖的意思就是pdf里的意思。
    原帖写的不明白,所以造成了误解,我个人比较同意你的看法。也就是说实际上概率与直觉是不相悖的。但是如果是随机大规模检测的话就与直觉相悖。而我们在生活中一般只看实际上的误诊概率,这种大规模检测误诊概率是不看的,所以原帖所说的与直觉相悖没有什么实际意义。
    @Ekoms

    [0] |
  • 37楼
    2012-01-15 14:52 Ekoms 数学/化学爱好者 只看Ta
    引用@jiangxj 的回应:
    你错了!
    你自己也知道你错在哪!
    你有意识的用“例行体检”替换了“某一个人去检测艾滋”
    “例行体检”是每个人都会发生的事件,取整体概率是正确的。
    “某一个人去检测艾滋”并不是普通人会发生的事件,不能取整体概率!
    把人分为二类,一类是可能得了艾滋的,一类是不可能已得艾滋的,我想可能已得艾滋的比例很小可能只占总体的1/10,而“某一个人去检测艾滋”这“某一个人”应该是这1/10中已经出现某种症状的人,这种人是1/10中的少数,这种群体的概率远远不是普通人的概率,他们得“艾滋”的概率可能是10%,这个10%才是公式中就取的发病率。


    题目一开始说“一人用颤抖的双手拿着艾滋病检测呈阳性的化验单去找医生”,“某一个人去检测艾滋”是你自己脑补出来的吧?输血肯定要查有没有艾滋肝炎之类的血液传播疾病,稍微大一点的手术也会查避免医务人员不知情的情况下中招,在这种情况下我觉得采用普通人患病几率更靠谱。
    关键是,这不是本题的主要矛盾好么?

    [0] |
  • 38楼
    2012-01-15 23:54 种田 只看Ta

    要火mark

    [0] |
  • 39楼
    2012-01-16 08:34 jiangxj 只看Ta
    引用@Ekoms 的回应:

    题目一开始说“一人用颤抖的双手拿着艾滋病检测呈阳性的化验单去找医生”,“某一个人去检测艾滋”是你自己脑补出来的吧?输血肯定要查有没有艾滋肝炎之类的血液传播疾病,稍微大一点的手术也会查避免医务人员不知情的情况下中招,在这种情况下我觉得采用普通人患病几率更靠谱。
    关键是,这不是本题的主要矛盾好么?

    对不起!
    查了一下原贴,原贴中确实没有“某一个人去检测艾滋”,这句话是楼主这里看到的。可能是先入为主的原因吧,我看到这句话后再看原贴自然构想成“某一个人去检测艾滋”而引发的故事了。
    不知楼主可否修改一下贴子,在贴子里加个结论,把不同的情况都写一下。

    [0] |
  • 40楼
    2012-01-16 18:19 都是_扯谈 电子工程专业 只看Ta
    引用@jiangxj 的回应:
    对不起!
    查了一下原贴,原贴中确实没有“某一个人去检测艾滋”,这句话是楼主这里看到的。可能是先入为主的原因吧,我看到这句话后再看原贴自然构想成“某一个人去检测艾滋”而引发的故事了。
    不知楼主可否修改一下贴子,在贴子里加个结论,把不同的情况都写一下。

    ”某一个人去检测艾滋“是我自己的问法,原帖里什么条件都没有。我觉得一般人都是主动自己去检测而不是因为大规模血检呈阳性而去检测。所以我认为原帖有疏忽之处。这个帖的后面已经加了我的理解了,应该还算明白易懂吧

    [0] |

最新帖子

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 家长监控 免责声明 联系我们 移动版 移动应用

©果壳网    京ICP证100430号    京网文[2018] 6282-492号    新出发京零字第朝200003号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:18612934101    网上有害信息举报专区    儿童色情信息举报专区