這兩天Facebook、twitter等社交網(wǎng)絡(luò)上開始流傳Judea Pearl在NIPS 2017演講的照片: 社交網(wǎng)絡(luò)上很多人都被這張照片震驚了,紛紛表示,貝葉斯網(wǎng)絡(luò)之父、因人工智能概率方法和因果推理算法獲得2011年圖靈獎(jiǎng)的Judea Pearl對(duì)著一個(gè)“幾乎空無一人的房間”做報(bào)告是NIPS上悲慘的一幕,這一天對(duì)機(jī)器學(xué)習(xí)而言是悲慘的一天。 Judea Pearl在UCLA的博士生Karthika Mohan將網(wǎng)上的消息告訴了Pearl,Pearl被社交網(wǎng)絡(luò)上人們的反應(yīng)逗笑了(amused by the reactions on social media)。 實(shí)際上,這張照片的拍攝者只是故意取了一個(gè)凸顯聽眾很少的視角。原本的報(bào)告廳可以容納幾百個(gè)聽眾,結(jié)果參加的有50-100人,因此某些區(qū)域聽眾很少,給了拍攝者進(jìn)行藝術(shù)加工的機(jī)會(huì)。 所以,事實(shí)上聽眾并沒有少到“幾乎空無一人”的程度,還是有幾十個(gè)聽眾的。而且,聽眾比預(yù)期的少,也有NIPS組織的問題。首先,當(dāng)時(shí)有多個(gè)講座同時(shí)進(jìn)行,分流了很多聽眾;其次,NIPS的應(yīng)用上并沒有標(biāo)明詳細(xì)信息,很多人根本不知道Judea Pearl會(huì)來做報(bào)告。 NIPS應(yīng)用中沒有演講者信息(圖片來源:latentjasper的推特) 既然上面那張照片是藝術(shù)加工的產(chǎn)物,那么下面這一張也有點(diǎn)可疑: 攝影者取景的角度,給人一種Pearl很落寞的感覺。實(shí)際上,老爺子可能只是演講完了坐一會(huì)休息一下而已,可能是在思考某個(gè)問題。 事實(shí)上,Pearl老爺子本人很淡定。Karthika Mohan說Pearl在NIPS報(bào)告之后很愉快地和學(xué)生解釋,過不了多久NIPS的參加者們就會(huì)撞上他報(bào)告里提到的機(jī)器學(xué)習(xí)理論上的限制。 但是,之所以說這兩種照片是“藝術(shù)加工”,而不是徹底的歪曲,因?yàn)?,某種意義上說,Pearl確實(shí)有些孤軍奮戰(zhàn)的味道。 Pearl在NIPS 2017上介紹了他2016年發(fā)表、2017年大修的報(bào)告《Theoretical Impediments to Machine Learning》。這個(gè)報(bào)告末尾列了17篇參考文獻(xiàn),其中,除了一篇哲學(xué)方面和一篇流行病學(xué)方面的論文,其余14篇論文Pearl本人均為第一或第二作者,剩下一篇的作者Adnan Darwiche(UCLA教授、JAIR主編、AAAI Fellow),博后是在UCLA跟Pearl讀的。 不知道你是否好奇,Pearl這篇報(bào)告具體是什么內(nèi)容?下面就跟我們一起來看看這篇報(bào)告吧。 當(dāng)前機(jī)器學(xué)習(xí)的限制如前所述,Pearl的報(bào)告有2016、2017兩個(gè)版本。在2016年的報(bào)告中,Pearl只是說當(dāng)前機(jī)器學(xué)習(xí)基于統(tǒng)計(jì)學(xué)模型,因此在表現(xiàn)上有一些理論上的限制。而在2017年的報(bào)告中,Pearl進(jìn)一步強(qiáng)調(diào)當(dāng)前機(jī)器學(xué)習(xí)基于模型盲目(model-blind)的統(tǒng)計(jì)學(xué)模型。在NIPS 2017報(bào)告現(xiàn)場(chǎng),更是直斥現(xiàn)有的機(jī)器學(xué)習(xí)只是又慢又呆的曲線擬合練習(xí)。 Pearl指出,當(dāng)前機(jī)器學(xué)習(xí)的表現(xiàn)提升,依賴于大量參數(shù)的調(diào)優(yōu),而這一過程,是非常緩慢和低效的。Pearl將其類比為基于自然選擇的達(dá)爾文演化。老鷹和蛇花了數(shù)百萬年才演化出了獨(dú)特的視覺系統(tǒng)。而人類在差不多一千年左右的時(shí)間里就發(fā)明了眼鏡和望遠(yuǎn)鏡。這是因?yàn)槿祟惥邆浯憝h(huán)境的心智表示,可以根據(jù)自己的意愿對(duì)這個(gè)心智表示進(jìn)行操作,想象出和當(dāng)前環(huán)境不同的假象環(huán)境——也就是說,人類會(huì)問“要是……會(huì)怎么樣”的問題,包括“要是我這么做,會(huì)怎么樣?”和“要是我當(dāng)初那么做了,會(huì)怎么樣?” “要是……會(huì)怎么樣”,背后其實(shí)隱含著因果推斷。 因果推斷的層次Pearl將因果推斷分為三個(gè)層次:
關(guān)聯(lián)是最簡(jiǎn)單的類型,可以直接從數(shù)據(jù)中根據(jù)條件和期望推斷出來。比如,統(tǒng)計(jì)分析數(shù)據(jù),發(fā)現(xiàn)價(jià)格下降了,銷量上漲了。用條件概率,可以形式化地表示為: P(y|x) 因?yàn)榭梢灾苯訌慕y(tǒng)計(jì)中推斷,所以當(dāng)前的機(jī)器學(xué)習(xí)很擅長(zhǎng)處理這類問題。 和關(guān)聯(lián)不同,介入就無法直接從數(shù)據(jù)中統(tǒng)計(jì)得出了。因?yàn)檫@涉及到反應(yīng),比如,價(jià)格下降了,消費(fèi)者既可能因?yàn)橛X得優(yōu)惠而增加購買,但也可能因?yàn)樯唐穬r(jià)格過低可能質(zhì)量有問題而減少購買,或者抱著“過一段時(shí)間說不定還會(huì)降”而持幣觀望。介入的條件概率可以形式化地表示為: P(y|do(x), z) 其中,z表示do(x)引起的事件。 當(dāng)前機(jī)器學(xué)習(xí)處理這樣的問題就沒有處理關(guān)聯(lián)那么輕松了,但仍可以通過訓(xùn)練歷史數(shù)據(jù),加上一些試驗(yàn)來建模介入問題。 介入面向的是未來的問題,如果我們讓介入回溯到過去,也就是說,從“要是我現(xiàn)在這么做,未來會(huì)發(fā)生什么”,回溯到“要是當(dāng)初我這么做,現(xiàn)在會(huì)發(fā)生什么”,我們就得到了因果推斷的第三個(gè)層次——反事實(shí)?;氐浇祪r(jià)的例子,反事實(shí)要問的是“要是當(dāng)初我們降價(jià)了,現(xiàn)在銷量會(huì)上漲嗎?”反事實(shí)的條件概率可以表示為: P(y_x|x', y') 上面的公式表示,在已知發(fā)生了事件x'和時(shí)間y'的前提下,我們想知道,假設(shè)過去發(fā)生的不是事件x',而是事件x的話,那么發(fā)生事件y的條件概率是多少? 當(dāng)前的機(jī)器學(xué)習(xí)無力回答反事實(shí)的問題,大多數(shù)機(jī)器學(xué)習(xí)模型甚至使用了不可能回答這一問題的表示。 而對(duì)于推斷因果關(guān)系而言,反事實(shí)是非常關(guān)鍵的。比如,感冒了,吃了感冒藥,感冒好了。這一經(jīng)歷并不能證明感冒藥的效果。我們想要知道感冒藥是否對(duì)治療感冒有效果,需要研究相應(yīng)的反事實(shí):“要是當(dāng)初沒吃感冒藥,現(xiàn)在感冒會(huì)不會(huì)好?”如果當(dāng)初沒吃感冒藥,現(xiàn)在感冒好了,那說明其實(shí)感冒藥并沒有起到作用,可能感冒是自愈的。 從上面的例子也可以看出,反事實(shí)在因果推斷的層級(jí)中,位于最高層。在環(huán)境和條件不變的前提下,如果我們知道“要是當(dāng)初沒吃感冒藥,現(xiàn)在感冒會(huì)不會(huì)好?”,那我們必然知道“我吃了感冒藥,感冒會(huì)不會(huì)好?”和“以前我吃過感冒藥,后來感冒好了沒有?”這兩個(gè)問題的答案。反之則不然。僅僅知道“我以前吃過感冒藥,感冒好了”,是無法確定“要是當(dāng)時(shí)沒吃感冒藥,感冒會(huì)不會(huì)好”這樣的問題的答案的。 現(xiàn)有的基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法缺乏反事實(shí)這一層級(jí)的信息,因而無法進(jìn)行反事實(shí)層面的推理,無論是總結(jié)過去的經(jīng)驗(yàn),還是預(yù)測(cè)當(dāng)前行動(dòng)的結(jié)果,都缺乏理據(jù)。這是現(xiàn)有機(jī)器學(xué)習(xí)方法理論上的缺陷。 意圖和ETT那么,該如何改進(jìn)現(xiàn)有的機(jī)器學(xué)習(xí)方法呢? 回顧一下表示反事實(shí)的條件概率: P(y_x|x', y') 從表面上看,x'和y'地位是平等的,都代表實(shí)際發(fā)生的、可以直接從數(shù)據(jù)中觀察到的事件。因此相對(duì)而言,似乎不需要我們重點(diǎn)關(guān)注。但實(shí)際上,x'和y'的情況是不一樣的。x'代表的是行動(dòng),或者說選擇,也就是說,實(shí)際選擇了行動(dòng)x',而不是x。這個(gè)選擇,往往隱含著關(guān)于行動(dòng)主體的一些信息。這些信息,有時(shí)和結(jié)果間存在因果關(guān)系。 比如,如果我們想分析參加某英語培訓(xùn)和英語成績(jī)提升之間的關(guān)系,那么最簡(jiǎn)單直接的辦法,就是統(tǒng)計(jì)參加培訓(xùn)的學(xué)生和沒參加培訓(xùn)的學(xué)生的成績(jī)提升(或下降)分值的平均值。從直覺上說,如果我們只統(tǒng)計(jì)十幾個(gè)學(xué)生,那可能因?yàn)闃颖酒疃鴮?dǎo)致不準(zhǔn)確的結(jié)果。反之,如果我們統(tǒng)計(jì)大量的學(xué)生,那樣本偏差的影響就越小,結(jié)果也越精確。這就是所謂大數(shù)據(jù)的威力。 然而,如果我們從反事實(shí)的角度去看,那我們就會(huì)發(fā)現(xiàn),上面統(tǒng)計(jì)方法可能存在再怎么增加樣本也沒法避免的偏差。參加培訓(xùn)的學(xué)生,事實(shí)上選擇了參加培訓(xùn),而不是不參加培訓(xùn),這一選擇本身就可能隱含了某些信息。比如,相比那些選擇不參加培訓(xùn)的學(xué)生,這些學(xué)生可能學(xué)習(xí)英語的意愿更強(qiáng),積極性更高。也就是說,即使這些學(xué)生當(dāng)初選擇不參加培訓(xùn),英語成績(jī)也會(huì)提升。 從統(tǒng)計(jì)的角度來說,這個(gè)參加培訓(xùn)的選擇隱含了一個(gè)未觀察到的混雜因子(confounder)。假設(shè)選擇參加培訓(xùn)的學(xué)生學(xué)習(xí)英語意愿更強(qiáng),積極性更高,那么這一點(diǎn)對(duì)參加培訓(xùn)和成績(jī)提升都有影響。也就是說,學(xué)習(xí)英語意愿更強(qiáng)、積極性更高的學(xué)生更容易選擇參加培訓(xùn),同時(shí)英語成績(jī)更容易提升(即使當(dāng)初沒有參加培訓(xùn))。 因此,反事實(shí)條件概率中的x',包含了關(guān)于行動(dòng)主體的重要信息,也就是行動(dòng)主體的意圖、動(dòng)機(jī)、反應(yīng)模式和其他未觀察到的特質(zhì)。 如果我們用X表示行動(dòng)(反事實(shí)中的x或x'),Y代表結(jié)果(反事實(shí)中的y或y'),那么我們就可以用下式來表示X和Y之間的因果推斷(用E表示): E(Y_x|X=x') 將x和x'交換一下,就是Pearl提出的ETT(Effect of Treatment on the Treated,參與治療的病人的治療效果): E(Y_x'|X=x) 其中,X=x表示實(shí)際的行動(dòng)(選擇)。如前所述,Y_x'表示了反事實(shí),X=x表示了意圖、動(dòng)機(jī)、反應(yīng)模式和其他未觀察到的特質(zhì)。 從名字就可以看出,這一理論在推斷治療方案療效方面很有用。實(shí)際上,ETT確實(shí)在醫(yī)學(xué)和經(jīng)濟(jì)學(xué)方面的研究中得到了廣泛應(yīng)用。 Pearl等人嘗試在機(jī)器學(xué)習(xí)中應(yīng)用了ETT?;舅悸啡缦拢?/p>
反復(fù)進(jìn)行后,得到了一個(gè)意圖和行動(dòng)可能不一致的數(shù)據(jù)庫。基于這個(gè)數(shù)據(jù)庫,可以選擇在任一時(shí)刻對(duì)當(dāng)前意圖而言最大化期望回報(bào)的行動(dòng)。這一方法利用了意圖這一有用的信息,Pearl將其稱為意圖特定優(yōu)化(intent-specific optimization)。 意圖特定優(yōu)化提供了從試驗(yàn)中提取反事實(shí)信息的機(jī)制,從而提升了機(jī)器學(xué)習(xí)模型的表現(xiàn)。Pearl比較了代理直接按意圖行動(dòng)所得的結(jié)果和經(jīng)過意圖特定優(yōu)化再行動(dòng)的結(jié)果,表明意圖特定優(yōu)化提升了代理的表現(xiàn)。 因果推斷反事實(shí)和意圖特定優(yōu)化只是Pearl數(shù)十年來一直致力于研究的因果推斷理論的一部分,Pearl將其稱為“反事實(shí)算法”,作為因果推斷系統(tǒng)的第3根支柱。Pearl的因果推斷理論共有7大支柱:
Pearl同時(shí)開發(fā)了結(jié)構(gòu)化因果模型(Structural Causal Model, SCM),一個(gè)形式化地描述因果推斷的框架。 Pearl認(rèn)為,因果推斷理論的7大支柱,可以解決現(xiàn)有機(jī)器學(xué)習(xí)方法無法解決的問題,也就是突破現(xiàn)有機(jī)器學(xué)習(xí)的理論限制,SCM能表示現(xiàn)有機(jī)器學(xué)習(xí)模型難以表示的因果推斷。而現(xiàn)在的數(shù)據(jù)科學(xué),只是統(tǒng)計(jì)學(xué),稱不上科學(xué);現(xiàn)在的機(jī)器學(xué)習(xí),只是曲線擬合練習(xí),永遠(yuǎn)不可能實(shí)現(xiàn)強(qiáng)人工智能。 |
|