乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      掌握數(shù)據(jù)分析思維的第一步:如何思考問(wèn)題?

       blackhappy 2019-11-23

      在數(shù)據(jù)分析思維當(dāng)中,有一個(gè)非常重要的概念——反事實(shí)。

      也就是說(shuō)我們只能想象未發(fā)生的事情,而不能斷定未來(lái),在數(shù)據(jù)分析中叫做挖掘預(yù)測(cè)。因此正確的判斷因果關(guān)系非常難,無(wú)論在工作還是日常生活中。尤其是對(duì)于剛剛?cè)腴T(mén)數(shù)據(jù)分析的人來(lái)說(shuō),很容易陷入反事實(shí)的陷阱之中。

      日常決策的因果關(guān)系

      假設(shè)有這么一個(gè)場(chǎng)景:我昨天沒(méi)有睡好,天又下雨,結(jié)果我開(kāi)車出去撞了護(hù)欄。

      同時(shí)他又假設(shè)以下陳述均為事實(shí):

      1. 我昨晚沒(méi)睡好。

      2. 天下雨。

      3. 我在國(guó)內(nèi)第一次開(kāi)車。

      4. 北京交通標(biāo)識(shí)不清楚。

      5. 當(dāng)時(shí)正好一個(gè)人奔跑過(guò)來(lái),讓我驚恐。

      6. 我開(kāi)車前喝了一杯酒。

      7. 我酒量不高。

      8. 那么這個(gè)事故的原因是什么?都挺像的。

      作者分析,為什么你會(huì)覺(jué)得“下雨”是一個(gè)原因:

      如果當(dāng)天是天晴,那么天晴能不能成為事故的一個(gè)原因呢?大部分人可能會(huì)認(rèn)為天晴作為事故的一個(gè)原因比較奇怪。

      這可能是因?yàn)槲覀冇袀€(gè)潛在假設(shè),就是天晴是常態(tài)的,而下雨不是常態(tài)。但如果一個(gè)地方一天 24 小時(shí),一年 365 天都在下雨,那么天晴就成了一個(gè)不正常的狀態(tài)。在這種情況下,天晴反而讓我不習(xí)慣,最后讓我撞到護(hù)欄上去了。

      所以我們?cè)谡f(shuō)“下雨”是一個(gè)原因時(shí),背后其實(shí)已經(jīng)在潛在假設(shè)正常狀態(tài)是指天晴了。

      由此他提出一個(gè)觀點(diǎn):我們?cè)诜治鲈驎r(shí),潛在假設(shè)了一個(gè)正常的參考系。

      就像劃火柴著火,如果你問(wèn)原因是什么,人們會(huì)說(shuō)是劃火柴,而不會(huì)說(shuō)是存在氧氣。

      認(rèn)知科學(xué)家、心理學(xué)家 Steven Pinker (史蒂芬·平克) 在《思想本質(zhì)》里解釋說(shuō),我們通常把易于識(shí)別的那個(gè)因素當(dāng)作原因

      人們莫名其妙地將其中一個(gè)必要條件識(shí)別出來(lái),以此作為一個(gè)事件的原因,同時(shí)卻將其他條件作為該事件發(fā)生的動(dòng)因和輔助因素,即使這些條件與那個(gè)被識(shí)別出的原因是一樣不可或缺的。這些必要條件間的區(qū)別并不在于物理事件間的連接或它們所遵循的規(guī)律,而在于與某些其他事態(tài)的隱性對(duì)比。

      日常生活中的因果判斷,和我們的認(rèn)知,即大腦對(duì)于因果的理解有關(guān)系。

      掌握數(shù)據(jù)分析思維的第一步:如何思考問(wèn)題?

      認(rèn)知理解的因果關(guān)系

      我們來(lái)考慮這么一個(gè)問(wèn)題:

      一輛有軌電車馬上要撞向 5 個(gè)毫不知情的鐵路工人。假設(shè)此時(shí)你正站在交換機(jī)旁邊,你可以將電車扳到另一條軌道上,但那樣會(huì)撞上另一個(gè)毫不知情的鐵路工人。你會(huì)扳動(dòng)開(kāi)關(guān)嗎?

      然后想象另一個(gè)場(chǎng)景:

      你站在一座大橋上俯瞰,你可以扔下重物讓電車停止,以避免撞向 5 個(gè)工人,而唯一的重物是你旁邊的胖子。你會(huì)把他扔下去嗎?

      大多數(shù)人在第一種情況中選擇會(huì),而第二種情況選擇不會(huì)。同樣是犧牲 1 人救 5 人,為什么會(huì)有這樣的差異呢?

      平克通過(guò)人類語(yǔ)言中動(dòng)詞的研究,解釋說(shuō),人類的因果關(guān)系識(shí)別基于一個(gè)“力動(dòng)態(tài)”的心智模型

      在因果場(chǎng)景中,一個(gè)參與者被稱為“主動(dòng)力”:一個(gè)被設(shè)想為具有運(yùn)動(dòng)或靜止內(nèi)在傾向的實(shí)體。另一個(gè)參與者被叫做“拮動(dòng)力”:一個(gè)在主動(dòng)力上施加外力的實(shí)體,這個(gè)外力通常是對(duì)主動(dòng)力內(nèi)在傾向的反作用力。

      如果拮動(dòng)力的力量大于主動(dòng)力的內(nèi)在傾向性,那么主動(dòng)力從運(yùn)動(dòng)狀態(tài)變?yōu)殪o止,或反之。如果拮動(dòng)力的力量小于主動(dòng)力的內(nèi)在傾向性,那么主動(dòng)力則保持原始狀態(tài)

      簡(jiǎn)單說(shuō)就是,關(guān)于有因果相互作用的兩個(gè)物體,我們會(huì)假設(shè)一個(gè)是有內(nèi)在運(yùn)動(dòng)或靜止傾向的實(shí)體,而另一個(gè)是加之在它身上的力量(因)。最后這個(gè)實(shí)體是否運(yùn)動(dòng)(果),與它內(nèi)在傾向性和外在力量大小的差異決定。

      就像下圖,方塊和橢圓分別代表有內(nèi)在靜止和運(yùn)動(dòng)傾向的主動(dòng)力,箭頭代表拮動(dòng)力(注意有大小之分)。紅色代表主動(dòng)力最終運(yùn)動(dòng),藍(lán)色代表靜止,那么有 4 種狀態(tài):

      掌握數(shù)據(jù)分析思維的第一步:如何思考問(wèn)題?

      研究中的因果關(guān)系

      1、因果關(guān)系三層級(jí)

      開(kāi)篇我們提到了“反事實(shí)”,這是《為什么:關(guān)于因果關(guān)系的新科學(xué)》中的概念。這本書(shū)的作者 Judea Pearl (朱迪亞·珀?duì)枺┦菆D靈獎(jiǎng)得主,計(jì)算機(jī)科學(xué)家和哲學(xué)家。

      他指出,因果關(guān)系有 3 個(gè)層級(jí)??聪旅孢@張圖應(yīng)該可以大概明白:

      掌握數(shù)據(jù)分析思維的第一步:如何思考問(wèn)題?

      現(xiàn)在的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)還處在第一層。

      第二層是干預(yù),例如頭疼,服用阿司匹林。是在干預(yù)一個(gè)變量(人體內(nèi)阿司匹林的量),以影響另一個(gè)變量(頭疼的狀態(tài))。

      最高層“反事實(shí)”,假如吃完阿司匹林,頭不疼了。那是因?yàn)槌运幰鸬膯幔窟€是因?yàn)槲衣?tīng)到了某個(gè)好消息?還是因?yàn)槲耶?dāng)時(shí)吃的食物?我們需要能乘坐時(shí)光機(jī)回到過(guò)去,改變歷史:假如我當(dāng)時(shí)沒(méi)有吃阿司匹林,會(huì)發(fā)生什么?

      引用書(shū)里的一張圖,美國(guó)詩(shī)人 Robert Frost (羅伯特·弗羅斯特)的作品《未選擇的路》體現(xiàn)了反事實(shí)的概念:

      2、相關(guān)不是因果

      統(tǒng)計(jì)學(xué)里有個(gè)段子:一個(gè)國(guó)家的人均巧克力消費(fèi)量和諾貝爾獎(jiǎng)得主的人數(shù)之間存在正相關(guān)。

      那我們是不是要多吃巧克力呢?

      事實(shí)可能是,在富裕的西方國(guó)家,吃巧克力的人更多,在教育和科研上投入更多,因而產(chǎn)生更多諾獎(jiǎng)得主。這個(gè)“富?!?,同時(shí)導(dǎo)致了更多的巧克力消費(fèi)和更多的諾獎(jiǎng)得主,是一個(gè)“混雜”因子。

      混雜是一個(gè)一直以來(lái)困擾統(tǒng)計(jì)學(xué)家問(wèn)題。朱迪亞·珀?duì)栔赋?,統(tǒng)計(jì)學(xué)家總是高估或者低估混雜的影響

      例如,在有些研究中,能看到一長(zhǎng)串被控制的變量:收入、年齡、種族、宗教、身高、頭發(fā)顏色、性取向、健身頻率等等。而有的時(shí)候,又不愿意去控制一些變量。

      混雜之所以在統(tǒng)計(jì)學(xué)中如此難解決,根據(jù)作者的觀點(diǎn),是因?yàn)樗皇且粋€(gè)統(tǒng)計(jì)學(xué)概念,而是一個(gè)因果概念,屬于因果關(guān)系之梯第二層。

      但是在平常的工作中,還是有一些方法可以讓我們更好地區(qū)分相關(guān)與因果。在《原因與結(jié)果的經(jīng)濟(jì)學(xué)》里,作者提出,判斷因果還是相關(guān),可以先問(wèn) 3 個(gè)問(wèn)題:

      • 是否“純屬巧合”?

      • 是否存在第三變量?

      • 是否存在逆向因果關(guān)系?

      正確理解因果關(guān)系,是思維升級(jí)的利器。

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多