1,hadoop是大數(shù)據(jù)分析的完整生態(tài)系統(tǒng),從數(shù)據(jù)采集,存儲(chǔ),分析,轉(zhuǎn)運(yùn),再到頁面展示,構(gòu)成了整個(gè)流程采集可以用flume,存儲(chǔ)用hbase,hdfs,mangodb就相當(dāng)于hbase,分析用Mapreduce自己寫算法,還有hive做數(shù)據(jù)倉庫,pig做數(shù)據(jù)流處理,轉(zhuǎn)儲(chǔ)方面有sqoop,可以將hdfs中的數(shù)據(jù)轉(zhuǎn)換存儲(chǔ)到mysql,oracle等傳統(tǒng)數(shù)據(jù)庫,這就構(gòu)成了一整套大數(shù)據(jù)分析的整個(gè)流程 2,mangodb只是充當(dāng)存儲(chǔ)功能,是一款nosql數(shù)據(jù)庫,支持以json的格式存儲(chǔ) 3,所以從功能上來講,hadoop和mangodb是不一樣的,hadoop中可以用mangodb替換hbase,但是mangodb不能替換hadoop,一個(gè)是完整的生態(tài)系統(tǒng),一個(gè)是數(shù)據(jù)庫,兩個(gè)不一樣的概念 4,至于選擇用mangodb還是hbase,各有優(yōu)劣,不過使用較多的還是hbase,mangodb社區(qū)沒有hbase活躍,所以還是hbase吧
|
|