混合“云存儲”的前景展望 出處:萬方數(shù)據(jù) 李苗在 日期:2012-04-05
云計算的革命性在于它更方便地實現(xiàn)了計算資源的訪問。過去科研人員搞科研以及企業(yè)家推出新產(chǎn)品時,在人力資源、時間和資金上需要很大的投入,而云計算技術(shù)能夠讓他們以低成本、更簡捷的方式獲得這些資源,云計算能讓他們在計算速度和成本上獲得很強(qiáng)的經(jīng)濟(jì)性。
“云存儲”概念的誕生,是人類進(jìn)入信息時代后另一個里程碑性質(zhì)的跨越。同時,自“云存儲”提出和應(yīng)用之后,人們對它的風(fēng)險問題就一直非常關(guān)注。內(nèi)部私有“云存儲”的出現(xiàn)在一定程度上減少了人們對它的擔(dān)優(yōu)?!八接性啤碧峁┝藢⑵髽I(yè)關(guān)鍵數(shù)據(jù)應(yīng)用安全地擴(kuò)展到外部公有“云存儲”服務(wù)的解決方案。隨著云計算及相關(guān)技術(shù)熱潮的來臨,客戶的關(guān)注度不斷提高、各種分析預(yù)測和新聞報道也大量涌現(xiàn),這一切都顯示出云計算市場已經(jīng)步人重要的轉(zhuǎn)折階段,不久之后我們就能見到,企業(yè)客戶采納“云存儲”的步伐會越來越快。 1、“云存儲”的定義 對于廠商來說,把他們的技術(shù)與熱門的云計算應(yīng)用捆綁在一起,提高關(guān)注度,無疑是巨大的誘惑。而將原有產(chǎn)品簡單的重新命名為“云XX”則是常見的手段。但通常情況下,我們不能簡單地把傳統(tǒng)的SAN和NAS設(shè)備看做“云存儲”,因為它們提供的是共享模式的存儲資源oSAN實際上并不具備“云存儲”的特點(diǎn)—動態(tài)性、彈性與靈活性?!霸拼鎯Α笨梢噪S時、隨地的隨需訪問,而SAN系統(tǒng)則通過Zoning分區(qū),使用WWN(world wide names)地址。本質(zhì)上SAN的應(yīng)用是靜態(tài)的。傳統(tǒng)的垂直擴(kuò)展模式的SAN和NAS產(chǎn)品更是如此。而有些采用Scale-out橫向擴(kuò)展架構(gòu)的block協(xié)議存儲設(shè)備,如3PAR公司的InServ Storage Server,可以實現(xiàn)自動優(yōu)化和負(fù)載均衡,在SAN層面實現(xiàn)負(fù)載的動態(tài)分配;橫向擴(kuò)展的NAS產(chǎn)品也大同小異。不過,即使能夠橫向擴(kuò)展,SAN和NAS也并不適合做大規(guī)模公有“云存儲”應(yīng)用。 1.1“云存儲”的特點(diǎn) 真正的“云存儲”產(chǎn)品應(yīng)該具備如下特點(diǎn): 1)通過網(wǎng)絡(luò)訪問; 2)可共享; 3)以服務(wù)的形式銷售,并且按需付費(fèi); 4)具有非常大的彈性,容量可以動態(tài)縮減或者按需增長; 5)系統(tǒng)規(guī)模可以按需擴(kuò)展或者縮減。 目前,“云存儲”主要用于保存非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)是增長速度最快、最多也是最難管理的數(shù)據(jù)類型?!霸拼鎯Α奔夹g(shù)并不適合結(jié)構(gòu)化數(shù)據(jù)應(yīng)用,比如數(shù)據(jù)庫。因此,結(jié)構(gòu)化數(shù)據(jù)應(yīng)用的主要平臺還是傳統(tǒng)的企業(yè)級存儲設(shè)備。 1.2“云存儲”的優(yōu)勢 對于非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用來說,使用“云存儲”的好處顯而易見—存儲的總體成本更低。“云存儲”屬于一種服務(wù),因此不需要采購、管理和維護(hù)存儲硬件設(shè)備。根據(jù)服務(wù)類型的不同,“云存儲”即使不能完全消除成本,也能夠大幅降低數(shù)據(jù)中心的成本和存儲管理員的負(fù)擔(dān)。使用”云存儲”服務(wù)還可以避免昂貴的技術(shù)升級開銷,這種技術(shù)升級一般3至5年就要進(jìn)行一次,有的是為了獲得最新的技術(shù),有的只是為了給舊存儲設(shè)備購買代價不菲的維保服務(wù)。 為了滿足預(yù)期的數(shù)據(jù)增長量以及處理應(yīng)用峰值的要求,傳統(tǒng)存儲系統(tǒng)往往需要預(yù)留大量的空間資源?!霸拼鎯Α睉?yīng)用通過削減這部分閑置的空間資源,通常能夠達(dá)到接近100%的存儲資源利用率。除了降低存儲的總成本之外,“云存儲”的可擴(kuò)展性,以及從基本應(yīng)用到峰值負(fù)載的線性處理能力,都是其引人注目的特點(diǎn)。 2、“云存儲”的類型 2.1公有“云存儲” 目前,公共“云存儲”服務(wù)商的數(shù)量在快速增長,包括AT&T、Amazon、Iron Mountain(鐵山公司)、Microsoft等許多公司。他們使用的存儲架構(gòu)通常由低成本的存儲節(jié)點(diǎn)附加直連的消費(fèi)級硬盤組成,通過基于對象的存儲堆棧管理進(jìn)行跨節(jié)點(diǎn)的數(shù)據(jù)內(nèi)容分發(fā)。對“云存儲”的數(shù)據(jù)訪問一般使用Internet協(xié)議,常見的協(xié)議是REST(Representational State Transfer),少數(shù)情況下會使用SOAP(Simple Object Access Protocol)。在“云存儲”上,每個數(shù)據(jù)對象至少同時在兩個節(jié)點(diǎn)上保存,以獲得最佳的可恢復(fù)性和冗余度。“云存儲”服務(wù)的基本收費(fèi)模式一般以“X美元/GB/月”為單位進(jìn)行計算,各服務(wù)商的收費(fèi)模式略有差異,也許會有一些附加費(fèi)用,包括按數(shù)據(jù)傳箱量計費(fèi)以及網(wǎng)絡(luò)接人費(fèi)用。 海量的多租戶安全應(yīng)用是公有“云存儲”設(shè)計的基礎(chǔ)。在“云存儲”平臺中,每個客戶的數(shù)據(jù)以及所進(jìn)行的訪問都是相互隔離的。公有“云存儲”上可存放的數(shù)據(jù)類型非常廣泛,從靜態(tài)的非核心應(yīng)用數(shù)據(jù)、需要在線保存的歸檔數(shù)據(jù)、到備份數(shù)據(jù)和容災(zāi)數(shù)據(jù)等等。而對那些隨時會發(fā)生改變的活動數(shù)據(jù),“云存儲”并不適合。企業(yè)用戶對“云存儲”應(yīng)用最主要的擔(dān)心是安全問題,其次是性能間題。 2.2私有“云存儲” 私有“云存儲”系統(tǒng)通常運(yùn)行在企業(yè)數(shù)據(jù)中心內(nèi)部的專用硬件設(shè)施上,它不但具有同公有“云存儲”一樣的優(yōu)點(diǎn),還能夠解決安全性以及性能這兩個最關(guān)鍵的問題。私有“云存儲”的用戶(租戶)通常只有一個,即使是大型企業(yè),也僅僅是利用多租戶的特性,將不同部門或分支機(jī)構(gòu)的訪問進(jìn)行隔離。與公有“云存儲”相比,私有“云存儲”系統(tǒng)對擴(kuò)展性的要求不高,因此私有“云存儲”引擎的后端連接的很可能是傳統(tǒng)的存儲硬件設(shè)備。有個恰當(dāng)?shù)睦涌梢哉f明這一點(diǎn),HP的CloudStart平臺就是由HP BladeSystem Matrix服務(wù)器、HP StorageWorks EVA系列磁盤陣列以及Cloud Service Automation(CSA)軟件整合而成的私有“云存儲”架構(gòu)。HP的C1oudStart本身不是私有“云存儲”,因為它缺乏一個關(guān)鍵的元素,即“以服務(wù)為基礎(chǔ)”;不過,HP自己或他的合作伙伴都可以使用這套基礎(chǔ)設(shè)施,這些企業(yè)甚至可以把CloudStart當(dāng)做一個具備完善管理功能,隨用即付費(fèi)的“云存儲”產(chǎn)品提供給客戶。 另一個私有“云存儲”的例子是HDS的Cloud Service for Private File Tiering(面向私有文件層的云服務(wù)),一個源自HCP ( Hitachi Content Platform日立內(nèi)容平臺)產(chǎn)品的私有“云存儲”系統(tǒng)。HDS的私有“云存儲”設(shè)施放在客戶的數(shù)據(jù)中心里,但它歸Hitachi所有,并由Hitachi負(fù)責(zé)管理。除了初始安裝費(fèi)用之外,用戶只需按照使用的空間支付費(fèi)用。類似的產(chǎn)品還有Nirvanix公司的hNode,同樣在企業(yè)數(shù)據(jù)中心提供私有云服務(wù)。hNode也能提供完善的管理功能并采用隨用即付費(fèi)的銷售模式。Nirvanix的技術(shù)架構(gòu)叫做SDN(Storage Delivery Network),跟HDS的很相似。 雖然私有“云存儲”的出現(xiàn)化解了用戶對公有云應(yīng)用性能和安全性方面的擔(dān)優(yōu),但是對于非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用來說,私有云的必要性不大。首先,私有“云存儲”系統(tǒng)在設(shè)計上并沒有利用已有的存儲設(shè)施。事實上,構(gòu)建它有一定的前提,需要數(shù)據(jù)中心的場地、電力、機(jī)架空間以及冷卻系統(tǒng)。私有“云存儲”運(yùn)行在專用的硬件平臺之上,因此也不可能擴(kuò)展到像公有“云存儲”那么大的規(guī)模。大多數(shù)的非結(jié)構(gòu)化數(shù)據(jù)是靜態(tài)不變的,很少使用,因此沒有必要在數(shù)據(jù)中心本地部署前置設(shè)備或私有云。 2.3混合“云存儲” 由于僅有“云存儲”和私有“云存儲”的上述原因,混合“云存儲”應(yīng)運(yùn)而生?;旌显频男问揭话阋詡鹘y(tǒng)存儲系統(tǒng)或私有“云存儲”為主,公有“云存儲”作為補(bǔ)充。然而,一個理想的混合“云存儲”平臺必須滿足幾個關(guān)鍵的條件:首先,混合“云存儲”的整體表現(xiàn)必須均衡,除了會產(chǎn)生一點(diǎn)網(wǎng)絡(luò)延遲之外,訪問公有云上的數(shù)據(jù)應(yīng)該是無縫透明的。此外,數(shù)據(jù)遷移的機(jī)制必須保證活動的和經(jīng)常訪間的數(shù)據(jù)能夠快速被訪問,而靜態(tài)數(shù)據(jù)則被推向“云存儲”。因此,混合云一定要有智能的引擎,用來定義數(shù)據(jù)的移動策略,即何時推向云,以及何時從云端遷移回來。 實施混合“云存儲”,主要通過三個途徑: 1)利用“云存儲”軟件,將本地存儲和公有“云存儲”整合在一起; 2)使用“云存儲”網(wǎng)關(guān)設(shè)備; 3)通過應(yīng)用程序集成。 3、基于軟件的混合“云存儲”架構(gòu) 3.1混合“云存儲”軟件 目前,在不使用網(wǎng)關(guān)設(shè)備,用戶也不能自己動手集成的情況下實現(xiàn)混合“云存儲”只有一種可能,就是通過在私有云和公有“云存儲”上運(yùn)行一套軟件,將兩個存儲系統(tǒng)結(jié)合在一起,構(gòu)成一個單一的非對稱存儲云。相關(guān)技術(shù)的標(biāo)準(zhǔn)化工作正在積極地制定過程中,比如SNIA(Storage Networking Industry Association)定義的CDMI(Cloud Data Management Interface)。如果缺乏統(tǒng)一的技術(shù)標(biāo)準(zhǔn),集成這種非對稱的“云存儲”是無法實現(xiàn)的。因此,我們看到,云軟件廠商把他們的產(chǎn)品銷售給硬件制造商以及服務(wù)運(yùn)營商的產(chǎn)業(yè)模式是創(chuàng)造混合云的必要前提。同時,還有些“云存儲”廠商把他們的硬件堆疊打包并以私有“云存儲”的名義推向市場,這種產(chǎn)品一般可以跟他們的公有“云存儲”服務(wù)方便地進(jìn)行集成。 后一種類型的典型代表是Nirvanix。直到不久之前,Nirvanix還只能提供純粹的公有“云存儲”服務(wù),但在該公司發(fā)布hNode私有“云存儲”產(chǎn)品之后,用戶現(xiàn)在既可以在企業(yè)內(nèi)部使用Nirvanix的“云存儲”系統(tǒng),又可以根據(jù)需要補(bǔ)充Nirvanix Storage Delivery Network公有“云存儲”。 Rackspace公司此前提供基于云文件系統(tǒng)((Cloud Files)的公有“云存儲”服務(wù),現(xiàn)在,它把自己的Cloud Files轉(zhuǎn)為開源項目,并創(chuàng)建了OpenStack.org以推進(jìn)該項目的標(biāo)準(zhǔn)化進(jìn)程。Backspace試圖建立用戶端到服務(wù)運(yùn)營商之間的混合云架構(gòu),就像他們之前提供的公有“云存儲”服務(wù)一樣。 以前,構(gòu)建一套“云存儲”服務(wù)平臺只有兩種選擇:要么自己開發(fā)解決方案;要么使用開源的“云存儲”軟件,比如Luster或MogileFS,但使用開源產(chǎn)品的同時也必須接受它的特性和局限性。最近一兩年,商業(yè)化的“云存儲”軟件越來越多,相關(guān)廠商也都把企業(yè)級用戶和運(yùn)營服務(wù)商作為目標(biāo)客戶。 在目前可用的商業(yè)化產(chǎn)品之中,EMC的Atmos是最突出的一個。Atmos是一個以軟件為核心,支持硬件跨平臺,基于對象的堆疊存儲系統(tǒng)。它的結(jié)構(gòu)包括三層松散禍合的服務(wù)進(jìn)程:表示層提供客戶端接口,包括REST、SOAP和傳統(tǒng)的文件系統(tǒng)協(xié)議;元數(shù)據(jù)管理層決定數(shù)據(jù)對象保存在哪個存儲節(jié)點(diǎn),以及數(shù)據(jù)冗余保護(hù)和分布的策略;最下面的存儲層是存儲節(jié)點(diǎn)的接口。Atmos可以運(yùn)行在專用的硬件或VMware虛擬機(jī)之上。作為一個使用scale-out橫向擴(kuò)展架構(gòu)的系統(tǒng),通過簡單的增加存儲節(jié)點(diǎn),最大可以擴(kuò)展到PB級的存儲規(guī)模。EMC通常向企業(yè)級用戶和運(yùn)營服務(wù)商推銷Atmos,在客戶端部署的前置系統(tǒng)能夠同Atmos云服務(wù)相互綁定。 EMC最大的客戶是AT&T。AT&T的Synaptic Storage是虛擬的私有云。然而,作為混合“云存儲”,它的模式與其他公司的產(chǎn)品差別很大。Synaptic Storage運(yùn)行在AT&T自己的數(shù)據(jù)中心內(nèi),客戶卻可以通過AT&T的MPLS網(wǎng)絡(luò)訪間該系統(tǒng)。通過這種方式,AT&T將私有云的安全性和高性能與公有云的經(jīng)濟(jì)性和擴(kuò)展性很好的結(jié)合在一起。 除了EMC的Atmos,還有幾種“云存儲”軟件產(chǎn)品值得我們介紹。Caringo公司的CAStor Content Storage Software軟件是一個定位于CAS ( content addressable storage)內(nèi)容尋址應(yīng)用的“云存儲”產(chǎn)品解決方案。Cleversafe公司的“云存儲”平臺則利用IDA (information dispersal algorithms)算法將數(shù)據(jù)切片,并分散保存在“云存儲”平臺的多個節(jié)點(diǎn)上,這樣可以降低數(shù)據(jù)復(fù)本的需求。Cleversafe宣稱與那些為了保證冗余度而必須在存儲節(jié)點(diǎn)上保存多份數(shù)據(jù)拷貝的產(chǎn)品相比,他能做到更高的存儲資源利用率。 3.2混合“云存儲”網(wǎng)關(guān) “云存儲”網(wǎng)關(guān)位于企業(yè)內(nèi)部的存儲系統(tǒng)與公有“云存儲”之間。它的主要功能是將傳統(tǒng)的存儲協(xié)議轉(zhuǎn)換成專用的“云存儲”協(xié)議和API。以前,公有“云存儲”只有在和應(yīng)用定制集成之后才能被訪問。現(xiàn)在,通過“云存儲”網(wǎng)關(guān),企業(yè)內(nèi)部存儲上的數(shù)據(jù)就可以遷移到公有“云存儲”上,反向亦然,這通常取決于策略引擎的設(shè)置。 各廠商提供的“云存儲”網(wǎng)關(guān)之間的差別主要體現(xiàn)在幾個方面,首先要看產(chǎn)品是基于block協(xié)議還是基于文件協(xié)議,這決定了它們在企業(yè)數(shù)據(jù)中心的角色,是塊存儲設(shè)備還是NAS裝置。數(shù)據(jù)去重和壓縮功能是“云存儲”網(wǎng)關(guān)的關(guān)鍵特性,因為這兩種功能對“云存儲”的使用成本影響非常大,而且傳輸過程中和“云存儲”端的數(shù)據(jù)加密是非常必要的。有些網(wǎng)關(guān)對備份和歸檔應(yīng)用做了特殊的設(shè)計和優(yōu)化,有些則與Microsoft Exchange和SharePoint之類的應(yīng)用緊密集成,還有的產(chǎn)品被設(shè)計成交易處理型的存儲結(jié)構(gòu)中的一層,作為企業(yè)內(nèi)部存儲的補(bǔ)充。 3.3與應(yīng)用集成的混合“云存儲” 所有的公有“云存儲”服務(wù)都提供API,以便私有“云存儲”軟件和“云存儲”網(wǎng)關(guān)與其進(jìn)行互聯(lián)。但這些API也可以直接被應(yīng)用程序調(diào)用,實現(xiàn)應(yīng)用程序與公有”云存儲”的集成?!霸拼鎯Α盇PI能夠幫助企業(yè)內(nèi)部應(yīng)用或商業(yè)應(yīng)用系統(tǒng)通過REST接口充分利用公有“云存儲”的資源。 舉個例子,備份軟件廠商已經(jīng)開始在他們的備份產(chǎn)品套件中提供對公有云的支持。比如Symantec的NetBackup和Backup Exec,以及CommVault的Simpana備份軟件都可以同公有“云存儲”集成。 4、結(jié)束語 企業(yè)級客戶的態(tài)度—樂于接受“云存儲”。過去,企業(yè)級用戶在很大程度上是遠(yuǎn)離“云存儲”應(yīng)用的。不過,隨著私有“云存儲”的出現(xiàn),以及企業(yè)內(nèi)部存儲應(yīng)用逐步附加了安全集成公有l(wèi)混合“云存儲”的功能,企業(yè)安全地將現(xiàn)有存儲應(yīng)用擴(kuò)展到“云存儲”之上已經(jīng)變得越來越現(xiàn)實。 最近“云存儲”被熱炒,不過主要是在消費(fèi)、移動應(yīng)用領(lǐng)域,以及像Google、Dropbox之類的公共云服務(wù)。根據(jù)業(yè)內(nèi)專家的估計,即使再過5年,主流的企業(yè)級用戶也不可能完全采用“云存儲”。但在此期間,企業(yè)級用戶很可能策略性地增加一些混合“云存儲”作為他們現(xiàn)有存儲設(shè)施的補(bǔ)充。IDC調(diào)查數(shù)據(jù)顯示:到2013年,云存儲服務(wù)的增長率預(yù)計將超過所有其他IT云服務(wù)。在未來四年內(nèi),云服務(wù)的市場規(guī)模將從現(xiàn)在的174億美元增長到442億美元,其中,云存儲的市場比例將從目前的9%增長到14%,也就是說云存儲的市場規(guī)模將接近62億美元。 |
|