如果隨機(jī)變量X的所有可能取值不可以逐個(gè)列舉出來(lái),而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn),那么稱之為連續(xù)型隨機(jī)變量。例如,一批電子元件的壽命、實(shí)際中常遇到的測(cè)量誤差等都是連續(xù)型隨機(jī)變量。 連續(xù)型隨機(jī)變量X無(wú)法像離散型隨機(jī)變量一樣,給出其取每一個(gè)點(diǎn)時(shí)的概率,那么換一種思路,來(lái)研究隨機(jī)變量落入一個(gè)區(qū)間 的概率 ,當(dāng)區(qū)間 接近無(wú)窮小時(shí),這時(shí)我們使用概率密度來(lái)表示概率值。什么是概率密度?假設(shè)有一組零件,由于各種因素的影響,其長(zhǎng)度是各不相同的。具體數(shù)值如下。[171.671,172.04,171.67,172.40,172.70,172.164,171.71,172.68,172.13,171.97,172.266,171.81,172.15,172.45,172.20,172.600,172.24,171.39,172.17,171.2] 按前面離散型隨機(jī)變量的思路,要將數(shù)據(jù)分組,對(duì)應(yīng)每個(gè)組計(jì)算出其相應(yīng)的概率值,并繪制概率分布直方圖,如下圖所示。連續(xù)型隨機(jī)變量分組后的概率分布直方圖圖中的橫坐標(biāo)是隨機(jī)變量值,縱坐標(biāo)是隨機(jī)變量落入該值范圍內(nèi)的概率。直方圖的邊緣看起來(lái)有點(diǎn)粗糙,但當(dāng)我們把樣本數(shù)據(jù)和分組數(shù)同時(shí)增加時(shí),輪廓就會(huì)越來(lái)越細(xì)致,接近于如圖所示的曲線,這條曲線對(duì)應(yīng)的函數(shù)就稱為概率密度函數(shù)。由此思路,得到概率密度的數(shù)學(xué)描述如下。考慮連續(xù)隨機(jī)變量 落入?yún)^(qū)間區(qū)間 的概率,由概率分布函數(shù) 的定義可知 ,令 ,則設(shè)如果該極限存在,則稱 為在 點(diǎn)處的概率密度。概率密度 反映出概率在 點(diǎn)處的密集程度,可以設(shè)想一根的質(zhì)量不均勻的金屬桿,總質(zhì)量為1,概率密度相當(dāng)于桿上各點(diǎn)處的質(zhì)量密度。從上式中可得結(jié)論:若 在處連續(xù),則概率密度函數(shù) 是分布函數(shù) 的導(dǎo)函數(shù)。設(shè) 為連續(xù)型隨機(jī)變量, 在任意區(qū)間(a,b]上的概率可以表示為:下圖形象描繪出概率密度函數(shù) 和概率 之間的關(guān)系。概率 被看成曲線下的面積,用數(shù)學(xué)公式描述就是一個(gè)積分形式。連續(xù)型隨機(jī)變量X的分布函數(shù),也可寫(xiě)成:概率密度函數(shù)和分布函數(shù)具有以下性質(zhì)。(3)對(duì)于任何常數(shù)a<b,有:假設(shè)某零件誤差量在區(qū)間(-4,4)均勻分布,計(jì)算誤差量為1~3的概率。解:設(shè)隨機(jī)抽取一個(gè)零件的誤差量為X,隨機(jī)變量X在區(qū)間(-4,4)上均勻分布,X落在該區(qū)間任意點(diǎn)的概率相同,即概率密度為一常量。下圖中顯示均勻分布對(duì)應(yīng)的概率密度函數(shù)和分布函數(shù)。均勻分布對(duì)應(yīng)的概率密度函數(shù)和分布函數(shù)在Python中輸出正態(tài)分布概率密度函數(shù)和對(duì)應(yīng)的概率分布函數(shù)。解:如果一個(gè)隨機(jī)變量X具有概率密度函數(shù)則稱隨機(jī)變量X為正態(tài)分布隨機(jī)變量,并記為 。下面代碼模擬實(shí)現(xiàn)了一個(gè)均值 為0和方差σ2為1的正態(tài)分布。import numpy as npimport matplotlib.pyplot as pltimport scipy.stats as statsdef test_norm_pmf():# 正態(tài)分布是一種連續(xù)分布,其函數(shù)可以在實(shí)線上的任何地方取值# 正態(tài)分布由兩個(gè)參數(shù)描述:分布的平均值μ和方差σ2 mu = 0 # meansigma = 1#standard deviationx = np.arange(-5,5,0.1) #生成隨機(jī)數(shù)x#得到對(duì)應(yīng)的概率值yy = (1/(np.sqrt(2*np.pi*sigma*sigma)))*np.exp(-(((x-mu)**2)/(2*sigma*sigma)))fig, (ax0, ax1) = plt.subplots(ncols=2, figsize=(10, 5))ax0.plot(x, y)ax1.plot(x,stats.norm.cdf(x,0,1))ax0.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu,sigma))ax0.set_xlabel('x')ax0.set_ylabel('Probability density', fontsize=15)ax1.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu, sigma))ax1.set_xlabel('x')ax1.set_ylabel('Cumulative density', fontsize=15)fig.subplots_adjust(wspace=0.4)plt.show()test_norm_pmf() 正態(tài)分布對(duì)應(yīng)的概率密度函數(shù)和分布函數(shù)自然界中許多隨機(jī)指標(biāo)都服從一種“中間高,兩頭低”的概率特性。例如,一門(mén)課程的考試成績(jī),人的身高、體重等。正態(tài)分布這種“鐘形曲線”很好地反映了現(xiàn)實(shí)世界中的中間高、兩頭低的隨機(jī)現(xiàn)象。
|