今天我们要讲的是一个数学统计的例子,数据来自于一篇医疗期刊上发表的文章。看看究竟为什么这组数据会让很多人抓破脑袋,百思不得其解。
你们都知道肾结石是一种很痛苦的疾病吧?医学专家研究治疗胆结石的新方法,并且分别对照了两种方法对大小结石的有效性。我们看下面这张表:
| 方法 A | 方法 B | |
| 小结石 | 93{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445} (81/87) | 87{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445} (234/270) |
| 大结石 | 73{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445} (192/263) | 69{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445} (55/80) |
| 总共 | 78{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445} (273/350) | 83{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445} (289/350) |
表格里面是有效性的百分比,括号里面是治疗有效的病人和该组病人总数。这个数据表告诉我们什么?对小结石病人,方法A的有效率是93{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}(81/87),方法B的有效率是87{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}(243/270),哪个方法有效率高?方法A。我们继续看大结石病人,方法A的有效率是73{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}(192/263),方法B的有效率是69{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}(55/80),哪个方法有效率高?还是方法A。
既然方法A对大结石,小结石都比方法B有效,那么总体来说是不是方法A也更有效呢?哥哥说你这样问的话答案肯定是不一定。还真被他猜着了。我们把有效的病人加起来在计算百分比,得到的结果是这样的:总体有效率方法A是78{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}(273/350),方法B是83{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}(289/350),方法B好于方法A。
那怎么会这么奇怪啊?明明方法A无论在小结石还是大结石的比较中都比方法B好啊,为什么大小结石一起考虑时怎么反而方法B更好呢?不要说你们不明白,很长时间里很多成人都被这个问题所困扰。一直到1951年,一个叫辛普森的学生在他的论文里专门讨论了这个问题才彻底弄清。所以这样的现象,即分类时都占优势的选项在总体里却落后的现象,被称为辛普森悖论。
要理解辛普森悖论的最好的方法是用矢量图。你们还没有学过矢量,所以爸爸和你们讲一下简化的理解这个问题的方法。我们再来看一下表格,方法A在小结石大结石病人的试验里的数目是不一样的,哪一组的病人多呢?方法A大结石的病人多得多,所以73{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}对最后总结果的贡献要比93{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}来的大,结果也是这样78{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}更接近73{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}一点。同样方法B里面小结石病人多,这一组的有效率87{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}对最后方法B的总结果贡献大,最后的83{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}的确比较接近87{82d421373fcc3c8988724c178618587190cde72dc92a4674dcadf7bd8e705445}。简单地说,在我们在看分类数据时,要考虑各类或各组的权重,权重大的对最后结果的贡献就越多。
