乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      如何通俗地理解協(xié)方差和相關(guān)系數(shù)?

       taotao_2016 2019-06-25

      1 正相關(guān)與負(fù)相關(guān)

      1.1 相關(guān)性

      事物之間可能會(huì)有關(guān)系,這可以通過(guò)數(shù)據(jù)看出。比如要買房的人越多(下圖的城鎮(zhèn)化率可以簡(jiǎn)單理解為進(jìn)城買房的人數(shù)),房?jī)r(jià)就越高,兩者的關(guān)系稱為 正相關(guān) 

      城鎮(zhèn)化有另外一個(gè)反作用,降低出生率。城鎮(zhèn)化和出生率之間的關(guān)系就是負(fù)相關(guān) ,也就是說(shuō)城鎮(zhèn)化率越高、出生率會(huì)越低,所以說(shuō),“城鎮(zhèn)化是最好的避孕藥”:

      1.2 股票組合

      在現(xiàn)實(shí)生活中了解相關(guān)性是很有用處的,比如下面有三支股票,年度收益都是 10% 

      可以看到藍(lán)色、綠色這兩只股票走勢(shì)基本一致,也就是這兩者正相關(guān);而藍(lán)色、紅色走勢(shì)相反,藍(lán)色上漲的時(shí)候紅色下跌,也就是這兩者負(fù)相關(guān)?;鸾?jīng)理會(huì)傾向于把負(fù)相關(guān)的兩支股票做成一個(gè)組合,這樣收益率也還是 10% ,但是整個(gè)組合波動(dòng)會(huì)很小,整體看上去平穩(wěn)上升。

      這種相關(guān)性可以通過(guò)下面要介紹的 協(xié)方差  相關(guān)系數(shù) 來(lái)表示和計(jì)算。

      2 矩形的面積

      2.1 顏色

      假設(shè)有兩個(gè)隨機(jī)變量,身高  和體重  ,很顯然這兩者應(yīng)該是正相關(guān)

      ,也就是說(shuō)身高增加體重也會(huì)隨著增加。

      但是怎么通過(guò)數(shù)學(xué)來(lái)表達(dá)呢?我們來(lái)看一個(gè)例子,下面是某班同學(xué)的身高體重:

      這兩個(gè)隨機(jī)變量可以構(gòu)成二維平面上的點(diǎn)  ,可以把它們畫在直角坐標(biāo)系上。我們先畫出表中的前兩個(gè)點(diǎn):

      很顯然,相對(duì)于第一個(gè)點(diǎn)(152,45)而言,第二個(gè)點(diǎn)(160,54)橫坐標(biāo)增加了,同時(shí)縱坐標(biāo)也增加了;也就是說(shuō)第二個(gè)點(diǎn)代表的同學(xué),身高增加了的同時(shí)體重也增加了,這兩個(gè)點(diǎn)是正相關(guān)的,我們?cè)趦烧咧g畫一個(gè)紅色的矩形表示這兩者是正相關(guān)的關(guān)系:

      現(xiàn)在加入第三個(gè)點(diǎn)(172,44),這位同學(xué)可能比較瘦高,他和第一、第二位同學(xué)負(fù)相關(guān),用藍(lán)色的矩形來(lái)表示:

      接著增加第四個(gè)點(diǎn)(175,64),它和前面三個(gè)點(diǎn)都是正相關(guān);最后增加第五個(gè)點(diǎn)(180,80),它和去前面四個(gè)點(diǎn)全是正相關(guān)。所以這些矩形全是紅色的:

      畫完之后整體看上去是紅色的,這說(shuō)明  、  這兩個(gè)隨機(jī)變量整體上是正相關(guān)的關(guān)系,雖然其中間雜著兩個(gè)藍(lán)色的矩形。

      2.2 面積

      從圖形上可以看出紅色有優(yōu)勢(shì),說(shuō)明是正相關(guān)。下面來(lái)看看如何通過(guò)代數(shù)計(jì)算出這個(gè)結(jié)果。從第一個(gè)紅色矩形開(kāi)始:

      可以算出這個(gè)紅色矩形的面積為正:

      而某個(gè)藍(lán)色矩形:

      它的“面積”為負(fù):

      所以把所有的矩形的“面積”加起來(lái),如果為正那么說(shuō)明就是紅色矩形占優(yōu)勢(shì),也就是正相關(guān);反之則是負(fù)相關(guān);為0的話說(shuō)明哪個(gè)都不占優(yōu)勢(shì),則是不相關(guān)。就這里的具體問(wèn)題而言,很顯然紅色更占優(yōu)勢(shì),所以算出來(lái)為正(總共有  個(gè)矩形),是正相關(guān)。

      2.3 一般化

      如果有  個(gè)點(diǎn)的話,可以用:

      來(lái)表示組成矩形的兩個(gè)頂點(diǎn),那么所有矩形的面積的和就可以表示為:

      那么:


      3 協(xié)方差

      可以看出要計(jì)算面積還是挺麻煩的,數(shù)學(xué)家給出了一個(gè)簡(jiǎn)化的方案。

      3.1 簡(jiǎn)化

      按照剛才的計(jì)算方法,比如說(shuō)某一個(gè)點(diǎn)  ,需要和所有的  配對(duì),然后計(jì)算出得到的矩形的面積和。數(shù)學(xué)家就想用  的均值也就是期望  來(lái)代替所有的  ,以及用  的均值也就是期望  來(lái)代替所有的  

      這樣之前的面積計(jì)算公式就從:

      變?yōu)榱耍?/span>

      如此,計(jì)算就被大大簡(jiǎn)化了。下面用這種方法重新算下剛才的例子。

      3.2 具體的例子

      首先以  為原點(diǎn),構(gòu)建一個(gè)直角坐標(biāo)系坐標(biāo)系,它會(huì)把平面分為4個(gè)象限:

      容易知道,一、三象限的點(diǎn)和  正相關(guān),而二、四象限的點(diǎn)和  負(fù)相關(guān)。所以在一、三象限中各選一個(gè)點(diǎn),它們和  構(gòu)成的矩形是紅色的:

      在第四個(gè)象限中有一個(gè)點(diǎn),它和   構(gòu)成的矩形是藍(lán)色的:

      把所有矩形都畫出來(lái)的話(總共只有5個(gè)矩形,按照上節(jié)給出的算法總共需要畫10個(gè)矩形,可見(jiàn)現(xiàn)有算法確實(shí)大大簡(jiǎn)化了,點(diǎn)越多簡(jiǎn)化的效果越好),可以看到還是紅色占優(yōu),因此總體來(lái)看  、  依然是正相關(guān)的:

      3.3 協(xié)方差

      還要考慮一點(diǎn),每個(gè)點(diǎn)的概率是不一樣的,因此各個(gè)矩形的面積并非是平等的,或者說(shuō)權(quán)重是不一樣的,所以需要對(duì)面積和進(jìn)行加權(quán)平均,也就是對(duì)面積和計(jì)算數(shù)學(xué)期望,這就得到了:

      設(shè)  是一個(gè)二維隨機(jī)變量,若  存在,則稱此數(shù)學(xué)期望為  與  的 協(xié)方差(Covariant),記作:


      特別地有  。

      很顯然會(huì)有

      • 時(shí),    正相關(guān),即兩者有同時(shí)增加或者減少的傾向

      •  時(shí),   、  負(fù)相關(guān),即兩者有反向增加或者減少的傾向 

      •   時(shí),    不相關(guān)

      4 相關(guān)系數(shù)

      之前求出來(lái)的協(xié)方差是有單位的,比如身高  (單位:厘米)與體重   、  (單位:公斤)的協(xié)方差  的單位是:厘米 · 公斤。

      假如又有一個(gè)隨機(jī)變量,同學(xué)的年齡  (單位:歲),它和體重的協(xié)方差  的單位為:歲 · 公斤。那么到底體重與身高更正相關(guān),還是體重與歲數(shù)更正相關(guān)?,因?yàn)閱挝坏脑驅(qū)е挛覀儧](méi)有辦法進(jìn)行比較,所以:

      對(duì)于二維隨機(jī)變量  ,各自的方差為:


      則:

      稱為隨機(jī)變量  和  的 相關(guān)系數(shù) 。

      之前介紹過(guò)標(biāo)準(zhǔn)差是有單位的,比如剛才舉的例子身高  (單位:厘米)、體重  (單位:公斤)以及年齡  (單位:歲),相除之后:

      單位就約掉了,變成沒(méi)有單位的數(shù)了,就可以進(jìn)行比較了。比如剛才提到的身高  ,體重  以及年齡  ,假如說(shuō)根據(jù)數(shù)據(jù)算出來(lái):

      馬上可以知道相對(duì)于年齡,身高與體重之間的正相關(guān)關(guān)系更強(qiáng)烈。


      5 線性相關(guān)

      “正相關(guān)”或者“負(fù)相關(guān)”實(shí)際指的是    之間線性相關(guān)(此處證明省略了,對(duì)推導(dǎo)感興趣的可以參加我們的課程《概率論與數(shù)理統(tǒng)計(jì)》):

          除了“線性相關(guān)”之外,其實(shí)還可能是別的關(guān)系(下圖標(biāo)出了相關(guān)系數(shù),當(dāng)相關(guān)系數(shù)不為0時(shí),也就是說(shuō)“正相關(guān)”或“負(fù)相關(guān)”時(shí),在圖中都或多或少地呈現(xiàn)線性關(guān)系;當(dāng)不具備線性關(guān)系時(shí),比如說(shuō)W形、圓圈形等,相關(guān)系數(shù)為0):

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多