1 正相關(guān)與負(fù)相關(guān) 1.1 相關(guān)性 事物之間可能會(huì)有關(guān)系,這可以通過(guò)數(shù)據(jù)看出。比如要買房的人越多(下圖的城鎮(zhèn)化率可以簡(jiǎn)單理解為進(jìn)城買房的人數(shù)),房?jī)r(jià)就越高,兩者的關(guān)系稱為 正相關(guān) : 城鎮(zhèn)化有另外一個(gè)反作用,降低出生率。城鎮(zhèn)化和出生率之間的關(guān)系就是負(fù)相關(guān) ,也就是說(shuō)城鎮(zhèn)化率越高、出生率會(huì)越低,所以說(shuō),“城鎮(zhèn)化是最好的避孕藥”: 1.2 股票組合 在現(xiàn)實(shí)生活中了解相關(guān)性是很有用處的,比如下面有三支股票,年度收益都是 10% : 可以看到藍(lán)色、綠色這兩只股票走勢(shì)基本一致,也就是這兩者正相關(guān);而藍(lán)色、紅色走勢(shì)相反,藍(lán)色上漲的時(shí)候紅色下跌,也就是這兩者負(fù)相關(guān)?;鸾?jīng)理會(huì)傾向于把負(fù)相關(guān)的兩支股票做成一個(gè)組合,這樣收益率也還是 10% ,但是整個(gè)組合波動(dòng)會(huì)很小,整體看上去平穩(wěn)上升。 這種相關(guān)性可以通過(guò)下面要介紹的 協(xié)方差 和 相關(guān)系數(shù) 來(lái)表示和計(jì)算。 2.1 顏色 假設(shè)有兩個(gè)隨機(jī)變量,身高 ,也就是說(shuō)身高增加體重也會(huì)隨著增加。 但是怎么通過(guò)數(shù)學(xué)來(lái)表達(dá)呢?我們來(lái)看一個(gè)例子,下面是某班同學(xué)的身高體重: 這兩個(gè)隨機(jī)變量可以構(gòu)成二維平面上的點(diǎn) 很顯然,相對(duì)于第一個(gè)點(diǎn)(152,45)而言,第二個(gè)點(diǎn)(160,54)橫坐標(biāo)增加了,同時(shí)縱坐標(biāo)也增加了;也就是說(shuō)第二個(gè)點(diǎn)代表的同學(xué),身高增加了的同時(shí)體重也增加了,這兩個(gè)點(diǎn)是正相關(guān)的,我們?cè)趦烧咧g畫一個(gè)紅色的矩形表示這兩者是正相關(guān)的關(guān)系: 現(xiàn)在加入第三個(gè)點(diǎn)(172,44),這位同學(xué)可能比較瘦高,他和第一、第二位同學(xué)負(fù)相關(guān),用藍(lán)色的矩形來(lái)表示: 接著增加第四個(gè)點(diǎn)(175,64),它和前面三個(gè)點(diǎn)都是正相關(guān);最后增加第五個(gè)點(diǎn)(180,80),它和去前面四個(gè)點(diǎn)全是正相關(guān)。所以這些矩形全是紅色的: ![]() 畫完之后整體看上去是紅色的,這說(shuō)明 2.2 面積 從圖形上可以看出紅色有優(yōu)勢(shì),說(shuō)明是正相關(guān)。下面來(lái)看看如何通過(guò)代數(shù)計(jì)算出這個(gè)結(jié)果。從第一個(gè)紅色矩形開(kāi)始: ![]() 可以算出這個(gè)紅色矩形的面積為正: 而某個(gè)藍(lán)色矩形: ![]() 它的“面積”為負(fù): 所以把所有的矩形的“面積”加起來(lái),如果為正那么說(shuō)明就是紅色矩形占優(yōu)勢(shì),也就是正相關(guān);反之則是負(fù)相關(guān);為0的話說(shuō)明哪個(gè)都不占優(yōu)勢(shì),則是不相關(guān)。就這里的具體問(wèn)題而言,很顯然紅色更占優(yōu)勢(shì),所以算出來(lái)為正(總共有 2.3 一般化 如果有 來(lái)表示組成矩形的兩個(gè)頂點(diǎn),那么所有矩形的面積的和就可以表示為: 那么: 3 協(xié)方差 可以看出要計(jì)算面積還是挺麻煩的,數(shù)學(xué)家給出了一個(gè)簡(jiǎn)化的方案。 3.1 簡(jiǎn)化 按照剛才的計(jì)算方法,比如說(shuō)某一個(gè)點(diǎn) 這樣之前的面積計(jì)算公式就從: 變?yōu)榱耍?/span> 如此,計(jì)算就被大大簡(jiǎn)化了。下面用這種方法重新算下剛才的例子。 3.2 具體的例子 首先以 ![]() 容易知道,一、三象限的點(diǎn)和 ![]() 在第四個(gè)象限中有一個(gè)點(diǎn),它和 ![]() 把所有矩形都畫出來(lái)的話(總共只有5個(gè)矩形,按照上節(jié)給出的算法總共需要畫10個(gè)矩形,可見(jiàn)現(xiàn)有算法確實(shí)大大簡(jiǎn)化了,點(diǎn)越多簡(jiǎn)化的效果越好),可以看到還是紅色占優(yōu),因此總體來(lái)看 ![]() 3.3 協(xié)方差 還要考慮一點(diǎn),每個(gè)點(diǎn)的概率是不一樣的,因此各個(gè)矩形的面積并非是平等的,或者說(shuō)權(quán)重是不一樣的,所以需要對(duì)面積和進(jìn)行加權(quán)平均,也就是對(duì)面積和計(jì)算數(shù)學(xué)期望,這就得到了: ![]() ![]() ![]() ![]() ![]() ![]() 很顯然會(huì)有:
之前求出來(lái)的協(xié)方差是有單位的,比如身高 假如又有一個(gè)隨機(jī)變量,同學(xué)的年齡 ![]() ![]() 則: 稱為隨機(jī)變量 之前介紹過(guò)標(biāo)準(zhǔn)差是有單位的,比如剛才舉的例子身高 單位就約掉了,變成沒(méi)有單位的數(shù)了,就可以進(jìn)行比較了。比如剛才提到的身高 馬上可以知道相對(duì)于年齡,身高與體重之間的正相關(guān)關(guān)系更強(qiáng)烈。 5 線性相關(guān) “正相關(guān)”或者“負(fù)相關(guān)”實(shí)際指的是 ![]() ![]() |
|
來(lái)自: taotao_2016 > 《數(shù)學(xué)》