今天介紹的兩個概率論中的非常重要的概念,大數(shù)定律和中心極限定理。這兩個規(guī)律告訴我們,在不確定的世界里也是有規(guī)律可循的。 大數(shù)定律說的是部分數(shù)據(jù)在某些條件下可以反映總體規(guī)律,是對大系統(tǒng)可通過對其抽樣來研究整體特性的的理論基礎(chǔ)。專業(yè)一點的說法是隨機變量序列的前一些項(部分)的算術(shù)平均值在某種條件下收斂算術(shù)平均值(整體)。是不是很簡單??!和以往一樣,我們不關(guān)注定理的推導(dǎo),如果有興趣可以看一下教材(用到了切比雪夫不等式)。比如說我們抽檢一批產(chǎn)品的合格率是否滿足要求,而產(chǎn)品的數(shù)量非常多比如有幾十萬個,我們會抽樣n個批次,每一批次的抽樣都可以看成一次隨機實驗,三批抽樣的合格率的平均值如果都在95以上,我們就會認為整批產(chǎn)品的合格率超過了95%。這個依據(jù)就是大數(shù)定律。這個大數(shù)和我們平時看到被熱炒的大數(shù)據(jù)中的大數(shù)還不是一回事,但在抽樣這個角度確實有些關(guān)聯(lián)。要注意以下大數(shù)定律應(yīng)用的條件,就是隨機變量的數(shù)學(xué)期望存在,并且隨機變量之間相互獨立(可以簡單理解為每一次試驗是獨立的,相互之間沒有關(guān)系)。條件大家一定要注意,不然會用錯。 大數(shù)定律有兩個,一個叫辛欽大數(shù)定律-弱大數(shù)定律,還有一個叫伯努利大數(shù)定律。本質(zhì)上講的是一回事,伯努利大數(shù)定理說了另外一件事就是如果事件A可能發(fā)生,那么在足夠多的嘗試后就一定會發(fā)生(這不就是墨菲定律嘛,機場、高鐵站都有得賣,其實概率論里早就說清楚了,我還買了一本,哈哈哈)舉個例子,如果有天上掉餡餅的可能,那么在足夠多的天數(shù)的情況下這個餡餅一定會掉下來。腦洞開一下,如果氨基酸和蛋白質(zhì)有可能隨機形成,那么在足夠長的時間里一定會形成,如果生命有可能出現(xiàn),那么在足夠長時間里,一定會出現(xiàn)?。?!天哪,進化論難道是這么理解嗎?如果這么推論,那么一定會有外星智慧生命?。。毸紭O恐) 中心極限定理討論的是一種特殊的分布-正態(tài)分布出現(xiàn)的條件。之前我們介紹過,很多隨機現(xiàn)象都滿足正態(tài)分布,比如電路的熱噪聲、男人身高的分布等等。這個定理告訴我們,正態(tài)分布出現(xiàn)的充分必要條件(在科研的時候會用的著,如果我們看到的實驗數(shù)據(jù)符合正態(tài)分布,那說明實驗一定滿足了正態(tài)分布的條件,那個漂亮個高斯曲線實在是太熟悉了)。這個條件是啥呢? 均值和方差存在的獨立同分布隨機變量,那么他們疊加的結(jié)果,當(dāng)n充分大的時候,分布是滿足0-1正態(tài)分布?。。?!我的天啊,這不就是說如果結(jié)果是正態(tài)的,那么一定是由多個獨立同分布的現(xiàn)象疊加起來的嘛?。。。∥覀儗嶒炛锌吹降哪莻€結(jié)果高斯曲線,是若干不確定結(jié)果疊加的必然現(xiàn)象??!所以,那些個復(fù)雜系統(tǒng)呈現(xiàn)出來的某種狀態(tài)很可能滿足高斯分布,放心的用高斯函數(shù)去擬合吧! 中心極限定理還可以用其他兩種形式,一個叫李雅普諾夫定理,一個叫隸莫佛-拉普拉斯定理。李氏定理說的是不論相互獨立的隨機變量各自分布如何,當(dāng)n(隨機變量的個數(shù))足夠大的時候,也滿足正態(tài)分布。后面那個定理說的是二項分布的極限為正態(tài)分布!其實都是中心極限定理的某種補充和特例。從中心極限是不是可以得出,正態(tài)分布這個形式是復(fù)雜系統(tǒng)不確定性的一般規(guī)律呢?大家各自發(fā)揮想象吧。 至此,所有概率論的中的重點內(nèi)容介紹完了! |
|