今年全國卷2的高考作文題,有人說難,更多人說好。 怎么一個難法,怎么一個好法,這里不講。那是高中老師們的活兒,不搶生意。 這里只講作文題目里主人公的故事,數(shù)彈孔的統(tǒng)計學家,亞伯拉罕·瓦爾德(或者翻譯為沃爾德)。 亞伯拉罕·瓦爾德,猶太人,1902出生于克勞森堡(當時屬于奧匈帝國,現(xiàn)在屬于羅馬利亞)。 瓦爾德就是他,考沒考好就應記住 瓦爾德是位神童,也是一位學霸,1931年獲得維也納大學的數(shù)學博士學位。1938年,納粹德國占領奧地利,瓦爾德幸運而順利地逃到了美國,進入了哥倫比亞大學的統(tǒng)計研究小組。 這個小組里,全是世界級牛人,世界最頂尖的頭腦。比如,弗雷德里克.莫斯特勒,哈佛大學統(tǒng)計系的創(chuàng)建者,比如,諾伯特維納,控制論的創(chuàng)始人。 統(tǒng)計小組工作的地方 由于美國空軍迫切需要解決戰(zhàn)機損失率的問題,找到了瓦爾德。按照軍方的統(tǒng)計,機身上的彈孔數(shù)最多,如下表。 把彈孔數(shù)打在飛機圖上,就是這樣,如下。 為提高飛機的生存率,最好的辦法是加裝甲。但是,又不能加太多,否則影響飛機性能。 所以,裝甲只能加在最需要的地方。 從圖表看,軍方的意見是機身。 而瓦爾德的意見恰恰相反,是引擎。因為引擎中彈的飛機,大多數(shù)飛不回來了。 如果只關注那些順利返航的飛機的中彈情況,就會陷入邏輯誤區(qū),這就是大名鼎鼎的幸存者偏差(survivorship bias),或者是生存偏差。 這個理論,演繹出一套算法,到現(xiàn)在仍在運用。像臉書等科技公司,分析用戶偏好、處理用戶數(shù)據(jù)的時候,就用到了瓦爾德的理論。 軍方按瓦爾德的意見,給引擎加了裝甲,飛機的損失率果然大大降低。 除了這件牛事,瓦爾德在二戰(zhàn)期間還作了一個大貢獻。 軍方在驗收彈藥時,遇到難題。比如,收到生產商送來的10萬發(fā)子彈,怎么知道這批子彈合格不合格呢? 最好的辦法是把這10萬子彈一個一個打出去,就清楚多少是好子彈,多少是壞子彈了。 但是,這樣子彈就沒了。 常規(guī)的做法是抽樣調查。先確定一個抽驗數(shù)量,抽取1%的子彈出來,就是1000顆子彈,全部打出去,打完之后,得到合格率。 不過這樣的成本大不說,耗時長,效率還低。 瓦爾德提出了一個全新的辦法,序貫分析。在抽樣時,不事先規(guī)定總的抽樣個數(shù)(觀測或實驗次數(shù)),而是先抽少量樣本,根據(jù)其結果,再決定停止抽樣或繼續(xù)抽樣、抽多少,這樣下去,直至決定停止抽樣為止。 比如驗收10萬發(fā)子彈,要求合格率99%。先打100發(fā)子彈,如果不合格的子彈大于1,就不用再測試了,這批子彈極可能不符合要求;如果不合格的子彈小于1,通過數(shù)學計算,來判定下面還需不需要接著抽樣,還要抽驗多少。 序貫分析,在保證驗收結果準確性的前提下,大大提高了軍需物資的驗收效率,大大減少了浪費——原來需要打1000發(fā)子彈才能確定的合格率,可以只需要打二三百發(fā)就行了。 幸存者偏差是一種理性思維、系統(tǒng)思維,而序貫分析是一種開創(chuàng)性的數(shù)學思想。 在序貫分析和序貫分析的基礎上,瓦爾德提出一套全新的理論——統(tǒng)計決策論。 他認為,數(shù)據(jù)的采集、分析,不單是為了獲取信息,更重要的是,由此進行科學的決策。 戰(zhàn)后,瓦爾德將他的思想整理成一部著作《序貫分析》。 遺憾的是,在1950年12月,瓦爾德因飛機失事遇難。這位一生研究概率的大師,死在一件概率極低的事情上。 |
|