大數(shù)據(jù)IMF傳奇行動(dòng)絕密課程第23課：從物理執(zhí)行的角度透視Spark Job

看風(fēng)景D人 2019-02-24

展開全文

從物理執(zhí)行的角度透視Spark Job

1、再次思考pipeline
2、窄依賴物理執(zhí)行內(nèi)幕
3、寬依賴物理執(zhí)行內(nèi)幕
4、Job提交流程

1、再次思考pipeline
即使采用pipeline的方式，函數(shù)f對(duì)依賴的RDD中的數(shù)據(jù)集合的操作也會(huì)有兩種方式
1)f(record), f作用于集合的每一條記錄，每次只作用于一條記錄
2)f(records),f一次性作用于集合點(diǎn)全部數(shù)據(jù)
Spark采用第一種方式，原因：
1)無(wú)需等待，可以最大化的使用集群的計(jì)算資源
2)減少OOM的發(fā)生
3)最大化的有利于并發(fā)
4)可以精準(zhǔn)的控制每一個(gè)Partition本身（Dependency）及其內(nèi)部的計(jì)算（conpute）
5)基于lineage的算子流動(dòng)式函數(shù)式編程，節(jié)省了中間結(jié)果的產(chǎn)生，并且可以最快的恢復(fù)

2、思考Spark Job具體的物理執(zhí)行
Spark Application里面可以產(chǎn)生1個(gè)或多個(gè)Job，例如spark-shell默認(rèn)啟動(dòng)的時(shí)候內(nèi)部就沒(méi)有Job，只是作為資源的分配程序，可以在spark-shell里面寫代碼，產(chǎn)生若干個(gè)Job，普通程序中一般而言可以有不同的Action，每一個(gè)Action一般也會(huì)出發(fā)一個(gè)Job
Spark是MapReduce思想的一種更加精致和高效的實(shí)現(xiàn)，MapReduce有很多具體不同的實(shí)現(xiàn)，例如Hadoop的MapReduce基本的計(jì)算流程如下：首先是以JVM為對(duì)象的并發(fā)執(zhí)行的Mapper，Mapper中的map的執(zhí)行會(huì)產(chǎn)生輸出數(shù)據(jù)，輸出的數(shù)據(jù)會(huì)經(jīng)過(guò)Partitioner指定的規(guī)則放到Local FileSystem中，然后再經(jīng)由Shuffle、Sort、Aggregate變成Reducer中的reduce的輸入，執(zhí)行reduce產(chǎn)生最終的執(zhí)行結(jié)果。Hadoop MapReduce執(zhí)行的流程雖然簡(jiǎn)單，但是過(guò)于死板，尤其是在構(gòu)造復(fù)雜算法（迭代）時(shí)候非常不利于算法的實(shí)現(xiàn)，且執(zhí)行效率極為低下！
Spark算法構(gòu)造和物理執(zhí)行時(shí)最基本的核心：最大化pipeline
基于Pipeline的思想，數(shù)據(jù)被使用的時(shí)候才開始計(jì)算，從數(shù)據(jù)流動(dòng)的視角來(lái)說(shuō)，是數(shù)據(jù)流動(dòng)到計(jì)算的位置！實(shí)質(zhì)上從邏輯的角度來(lái)看，是算子在數(shù)據(jù)上流動(dòng)。
從算法構(gòu)建的角度而言：算子作用于數(shù)據(jù)，所以是算子在數(shù)據(jù)上流動(dòng)；方便算法的構(gòu)建
從物理執(zhí)行的角度而言：是數(shù)據(jù)流動(dòng)到計(jì)算的位置！方便系統(tǒng)最為高效的運(yùn)行！

對(duì)于pipeline而言，數(shù)據(jù)計(jì)算的位置就是每個(gè)Stage中最后的RDD，一個(gè)震撼人心的內(nèi)幕真相就是：每個(gè)Stage中除了最后一個(gè)RDD算子是真實(shí)的以外，前面的算子都是假的！
由于計(jì)算的lazy特性，導(dǎo)致計(jì)算從后往前回溯，形成Computing Chain，導(dǎo)致的結(jié)果就是需要首先計(jì)算出具體一個(gè)Stage內(nèi)部左側(cè)的RDD中本次計(jì)算以來(lái)的Partition

3、窄依賴的物理執(zhí)行內(nèi)幕：
一個(gè)Stage內(nèi)部的RDD都是窄依賴，窄依賴計(jì)算本事從邏輯上看是從Stage內(nèi)部最左側(cè)的RDD開始立即計(jì)算的，根據(jù)Computing Chain，數(shù)據(jù)（Record）從一個(gè)計(jì)算步驟流動(dòng)到下一個(gè)計(jì)算步驟，以此類推。直到計(jì)算到Stage內(nèi)部的最后一個(gè)RDD來(lái)產(chǎn)生計(jì)算結(jié)果。
Computing Chain的構(gòu)建是從后往前回溯構(gòu)建而成，而實(shí)際的物理計(jì)算則是讓數(shù)據(jù)從前往后在算子上流動(dòng)，直到流動(dòng)到不能再流動(dòng)的位置才開始計(jì)算下一個(gè)Record。這就導(dǎo)致一個(gè)美好的結(jié)果：后面的RDD對(duì)前面的RDD的依賴雖然是Partition級(jí)別的數(shù)據(jù)集合的依賴，但是并不需要父RDD把Partition中所有的Records計(jì)算完畢才整體往后流動(dòng)數(shù)據(jù)進(jìn)行計(jì)算，這就極大的提高了計(jì)算速率！
4、寬依賴物理執(zhí)行內(nèi)幕：
必須等到依賴的父Stage中的最后一個(gè)RDD全部數(shù)據(jù)徹底計(jì)算完畢，才能經(jīng)過(guò)shuffle來(lái)計(jì)算當(dāng)前的Stage！

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：看風(fēng)景D人 > 《Spark學(xué)習(xí)總結(jié)》

舉報(bào)/認(rèn)領(lǐng)