今天看到某两人的对话,大概是这样的:
现在得甲流的80%都发烧!
楼上说得不对吧,应该是现在80%发烧的得的都是甲流!
仔细想想,这个问题其实很有趣。设想:如果以上两条都成立,也就是得甲流80%发烧、发烧的80%是甲流,我们能推出什么结论呢?
其实这是一个典型的条件概率问题。一般的,在B发生的情况下A发生的概率可以表示为P(A|B)。那么“得甲流80%发烧”可以表示为P(发烧|甲流)=0.8。不妨用P(甲流)来表示得甲流的概率(得甲流人数与总人数的比值,下似),那么P(甲流)×P(发烧|甲流)就是既得甲流又发烧的概率,既P(甲流)×P(发烧|甲流)=P(甲流∩发烧)。同样的,“发烧的80%是甲流”可以表示为 P(甲流|发烧)=0.8、P(发烧)表示发烧的概率,那么P(甲流∩发烧)又可以表示为P(发烧)×P甲流|发烧)。于是,我们得到了一个这样的推论:P(甲流)×P(发烧|甲流)=P(发烧)×P(甲流|发烧)。由于P(发烧|甲流)=P(甲流|发烧)=0.8,所以P(甲流)=P(发烧)
而刚才我们得到的推论,也就是贝叶斯定理,其一般形式为:
请设想下面一个情景:某种酒精检测仪在对吸烟的人使用时99%报阳性、1%报阴性,而在对不吸烟的人使用的时候99%报阴性、1%报阳性。已知学校中吸烟的学生大概占1%,请问如果对某学生的检验程阳性,那么该学生吸烟的概率是多少?
肯能你会很果断得从直觉判断99%,但是有时候人的直觉却是错的。
其实如果检验程阳性学生吸烟的概率就是P(吸烟|阳性)。根据贝叶斯公式:P(吸烟|阳性)=P(阳性|吸烟)P(吸烟)/P(阳性)。P(阳性|吸烟)和P(吸烟)都是已知条件,而P(阳性)其实就是P(吸烟)×P(阳性|吸烟)+P(不吸烟)×P(阳性|不吸烟)。化简整理,P(阳性|吸烟)P(吸烟)/[P(吸烟)×P(阳性|吸烟)+P(不吸烟)×P(阳性|不吸烟)]=(0.99×0.01)/(0.99*0.01+0.01*0.99)=50%!远远低于99%!而如果把原数据中的“学校中吸烟的学生占1%”改成“0.5%”,所求概率将进一步降低到33.22%!
另外,贝叶斯定理还在中文分词、机器翻译、垃圾邮件过滤和人工智能方面有着很多的应用。在这里我就不多写了,更多请看这篇强文!


看到“不对,只是发烧和甲流的人数会是一样的。并不是重合的”,我实在无语了,你这话比那两人的还甚得慌。
甲流只是一个引子,主要是在论述一个概率问题。