这本书的主题并非只是谈论“该死的谎言与统计学”。达雷尔?赫夫(D a r r e l l H u f f )、约翰?艾伦?包洛斯(J o h n A l l e n P a u l o s )、爱德华?塔夫特(Ed Tufte)、霍华德?维纳(Howard Wainer)等人,在这个常谈常新的话题上早就写下了不少垂范之作。的确,从精于操控的政治家到粗心大意的分析员,从经济学爱好者到强买强卖的广告商,我们可以举出无数的例子,来说明当数字被滥用时会引发多少问题。择优选择、过度简化、故意混淆,这几种滥用数字的花招想必我们都领教过了。在这本书中,我们将沿着不同的方向,从正面的立场来思考:当事情顺利进行的时候会出现什么结果,也就是说,当数字没撒谎时会怎么样。我对这个问题很感兴趣。
知道得越多,越不了解真相
伯尼?麦道夫(B e r n i e M a d o f f )是纽约一家投资公司的资产管理人。到2 0 0 8 年他认罪伏法时为止,一个存在了3 0 年的由富人参加的投资俱乐部,被他弄得一贫如洗。直到此时,人们才识破麦道夫的真面目——一个惊天巨骗。那么,从麦道夫欺诈案中,我们能学到些什么呢?安然公司高层拿假账混淆视听,使数千名雇员的退休储蓄金随着公司的破产而顷刻化为乌有。那么,安然高层的欺诈案又能带给我们一些什么样的思考呢?或许我们该搞清楚:为什么大量的财务数据、财务报表及办公存档几乎未能给调查员、审计员和监管机构提供任何线索,找到何人与欺诈有关呢?
我们从万络(V i o x x )事件中又能学到点儿什么呢?美国食品药品管理局(F D A )承认,该药在首次获准入市到后续的五年中,引起了上万起心脏病病例。或许我们该弄清楚:为何虽有大量现成的健康医疗资讯以及大规模的、复杂精妙的临床试验,也未能使万络的发明人默克公司、医生及病人对这种新药的致命副作用重视起来呢?
我们开始考察一些有积极意义的事例,看看那些富有进取心的人们是如何机智地利用这些新资讯来改善我们的世界的,并借助这些好消息来平复上面的陈述带给我们的挫败感。在后续的五章,你将幸会那些使明尼苏达州的高速公路保持畅通的工程师、提醒人们当心不安全食品的疾病侦探(d i s e a s e d e t e c t i v e )、替佛罗里达的居民计算他们该为自己的房子投多少飓风保险的精算师、那些致力于开发标准化考试(如S A T )的教育专家、那些仔细检查精英运动员血液样本的实验室技师、那些声称能甄别谎言的数据挖掘师、那些涉嫌欺诈的博彩业执业人员、那些设计出奇思妙招缩短了队列的迪士尼乐园科学家、那些引发了消费信贷高潮的数学家,还有那些为人们的空中旅行提供最佳建议的研究人员。
第二,我们不必为变异寻找一个合理的解释,尽管我们有一种与生俱来的、对任何事情进行理性诠释的欲望,但如果两件事物之间存在相关模式,统计学家同样很乐意观察它。在第2 章中,我们追溯了疾病侦探追查污染菠菜的整个过程,又在另一个故事中撬开了产生信用分数的黑箱子。在“追查污染菠菜”这个案例中,(流行病学家)使用的是随机模型(c a s u a l mo d e l s),而产生“信用分数”所使用的则是相关模型(c o r r e l a t i o n m o d e l s )。我们对这两种建模方式进行了对比。令人惊讶的是,这些从业人员坦言,他们的模型不能完美地描述周围的世界,从这个意义上说,这两个模型都是“错误的”。我们接下来要看看他们是如何为自己辩护的。
第三,统计学家时常会寻找那些被错过的细微差别:统计平均数(s t a t i s t i c a l a v e r a g e )也许正好掩盖了各组间存在的重大差异。忽视这个差异通常预示着将来的不公平对待。分组的典型方式,比如按种族、性别或者收入,通常是有缺陷的。第3 章介绍了保险业。为了反映海岸和内陆地区的房产在遭受飓风风险上的差异,保险公司对保险价格进行了调整。我们对这种做法所带来的混合效果进行了评价。我们也考察了标准考试的设计者为消除黑人和白人在考试表现上的悬殊差距所做出的努力以及由此所带来的后果。
理论科学中最漂亮的某些发现,产生于一组经过审慎选择的、简化过的猜想;应用科学家注意到一些令人出乎意料的细节,并进行了处理,使这些结果能够适用于真实世界。如果你读过纳西姆?塔勒布(N a s s i m T a l e b )的著作,你会认识到钟形曲线其实就是这样一种简化,在某些情况下需要对之进行完善。另一个例子,请参看第3 章,明显属于不同组的人本该区别对待却被混在了一起。
以下为对购买帮助不大的评价