在創(chuàng)業(yè)公司廠商的引領(lǐng)下,結(jié)合云計算平臺、集中管理功能,以及自動化與AI智能化分析輔助技術(shù)的云計算AI存儲管理平臺,已成為當前存儲廠商重點發(fā)展的服務(wù)之一。 現(xiàn)在包括幾家主要的存儲龍頭廠商——Dell EMC、HPE、IBM與NetApp,以及全快閃存儲領(lǐng)導(dǎo)廠商之一的Pure Storage,都提供了云計算AI存儲管理平臺,來協(xié)助用戶管理存儲環(huán)境。 云計算AI存儲管理平臺的主要推手 智能化的云計算存儲管理平臺,誕生至今已有3~5年的歷史,最初是由創(chuàng)業(yè)公司廠商領(lǐng)頭發(fā)展,先驅(qū)是存儲創(chuàng)業(yè)公司廠商Nimble Storage的InfoSight,這個平臺的發(fā)布可以追溯到2013年。接下來同屬創(chuàng)業(yè)公司廠商的SolidFire與Pure Storage,也分別于2014與2015年推出同類的Active IQ與Pure1平臺。 在一線大廠方面,最早投入的是IBM,在2015年初時,將原屬于Tivoli Storage Productivity Center產(chǎn)品家族之一的Spectrum Control Storage Insights集中管理控制臺,集成到云計算環(huán)境后,成為云計算化的智能集中存儲管理平臺,正式進入了這個領(lǐng)域,2018年以后則更名為Storage Insights。存儲業(yè)界龍頭Dell EMC也在2016年中跟進,推出了CloudIQ云計算管理平臺。 后來隨著HPE于2017年并購Nimble Storage,以及NetApp于2015年并購SolidFire,Nimble的InfoSight與SolidFire的Active IQ這兩個平臺,也分別成為HPE與NetApp旗下產(chǎn)品。 所以,目前主要的云計算AI存儲管理平臺,便包括這5個產(chǎn)品——Dell EMC的CloudIQ、HPE Nimble的InfoSight,IBM的Storage Insights、NetApp的Active IQ,以及Pure Storage的Pure1。 云計算AI存儲管理的架構(gòu)與功能 我們可以把云計算AI存儲管理平臺,看成是存儲集中管理平臺的高端延伸發(fā)展。最基本的存儲系統(tǒng)控制臺,一次只能管理一臺設(shè)備;集中管理平臺,則能同時管理多臺設(shè)備;而云計算AI存儲管理平臺則更進一步,把集中管理平臺的功能搬上云計算,然后再于后臺結(jié)合自動診斷與AI分析預(yù)測功能而成。 無論哪一個廠商的云計算AI存儲管理平臺,基本運行方式都是相似的,先由用戶端激活存儲設(shè)備的自動支持功能,將運行狀態(tài)數(shù)據(jù)持續(xù)上傳到存儲廠商的云計算數(shù)據(jù)中心。而云計算數(shù)據(jù)中心則借由持續(xù)收集與累積用戶端的存儲設(shè)備原始運行數(shù)據(jù),經(jīng)由各式演算與分析方法處理后,向用戶提供這3種基本功能: (1 )云計算管理控制臺:匯集整理用戶端存儲設(shè)備的運行數(shù)據(jù),然后通過圖形化網(wǎng)頁控制臺接口,向用戶呈現(xiàn)存儲環(huán)境的當前或歷史運行狀態(tài)信息。同時也作為其他功能—主動式診斷與報修,以及AI分析預(yù)測服務(wù)的操作接口。 (2)主動健康診斷與報修服務(wù):通過檢測用戶端存儲設(shè)備回傳的運行狀態(tài)數(shù)據(jù),當發(fā)現(xiàn)異時常,主動通知用戶,并自動創(chuàng)建報修案件。 (3)AI存儲資源分析與預(yù)測:利用AI模型分析用戶端存儲設(shè)備回傳的運行狀態(tài)數(shù)據(jù),判斷用戶存儲應(yīng)用特性,進而預(yù)測用戶端存儲資源需求,為用戶提供存儲組態(tài)調(diào)整與升級的指引。 雖然各廠商云計算AI存儲管理平臺的基本概念彼此相似,但在這4個方面——云計算管理控制臺的管理范圍、系統(tǒng)診斷與分析預(yù)測功能的深度、存儲范圍以外的管理能力,以及網(wǎng)絡(luò)安全考量,仍存在著許多差異。 云計算管理控制臺的管理范圍 關(guān)于云計算管理控制臺的管理范圍,可以分為支持的前端設(shè)備類型,以及提供的管理層次,也就是管理的“廣度”與“深度”兩方面。 云計算管理控制臺的管理廣度 云計算管理控制臺的管理廣度,能用支持的存儲設(shè)備類型多寡來衡量。原則上,云計算管理控制臺能支持的設(shè)備類型越多,越能適應(yīng)各式各樣用戶端環(huán)境。 所有的云計算AI存儲管理平臺,一開始都是存儲廠商針對某款存儲數(shù)組產(chǎn)品所發(fā)展,然后才將支持范圍擴展到其他產(chǎn)品上。經(jīng)過幾年發(fā)展后,云計算存儲管理控制臺支持的產(chǎn)品類型已漸趨齊備,已能涵蓋各廠商旗下主要的存儲產(chǎn)品線。 比較特別的是IBM的Storage Insights,以及HPE Nimble InfoSight這兩個平臺。 一般而言,不同廠商的云計算管理控制臺,理所當然地都只能支持各自旗下的產(chǎn)品。但IBM的Storage Insights除了支持IBM自身的DS8000系列、FlashSystem系列、Storwize系列等產(chǎn)品外,還能“越界”支持Dell EMC的VMAX與VNX、VNXe等產(chǎn)品。 另一方面,云計算AI存儲管理平臺提供的管理控制臺,理所當然是以支持存儲設(shè)備的監(jiān)控為目的,但HPE Nimble的InfoSight,除了能支持HPE旗下的Nimble與3PAR兩個存儲產(chǎn)品線,還能支持HPE的ProLiant服務(wù)器,已經(jīng)跨出了存儲管理范圍,涵蓋了服務(wù)器管理。 云計算管理控制臺的管理深度 云計算管理控制臺的管理深度,指的是能提供的信息即時性與歷史長度,以及信息的范圍。 其中信息的即時性,是由存儲設(shè)備上傳信息的頻率所決定,目前云計算AI存儲管理平臺設(shè)置的數(shù)據(jù)更新頻率,最短的應(yīng)該是Pure Storage Pure1,每30秒一次,其他平臺最密集的大約為5分鐘一次,一些較不緊要的信息,可能是一小時或一天才更新一次,所以云計算管理控制臺提供的信息,不是完全即時的,會有數(shù)十秒到幾分鐘以上的落差。 至于數(shù)據(jù)保留的歷史長度,一般是一年以內(nèi),最長的是Dell EMC CloudIQ可保存2年期限,IBM Storage Insights對部分數(shù)據(jù)也能提供2年保存期。 而在提供的信息范圍方面,云計算平臺會收集包括容量、壓縮率、訪問延遲、IOPS、處理器使用率。到溫度、風(fēng)扇速度、電壓等一系列存儲設(shè)備信息,經(jīng)過匯集整理后,以圖形化儀表板向用戶提供容易掌握與理解的信息,從最基本的存儲設(shè)備硬件組件健康狀態(tài),以及當前的存儲資源使用狀態(tài)(處理器與存儲空間的耗用、存儲區(qū)的IOPS與傳輸率等),到高端的歷史性能信息等(指定時間區(qū)段的存儲資源情況信息)。 除了存儲層面的信息外,一些云計算管理控制臺,如HPE Nimble的InfoSight、Pure Storage的Pure1,與Dell EMC的CloudIQ,還能讓用戶進一步審查在存儲環(huán)境上層運行的Hypervisor虛擬平臺,提供從Hypervisor主機到個別VM層級的I/O與存儲狀態(tài)信息,提供更深度的資源使用信息。 系統(tǒng)診斷功能的深度 云計算AI存儲管理平臺的系統(tǒng)診斷功能,也能分為不同的層次。 最基本的層次,是幫助維持用戶存儲環(huán)境的系統(tǒng)可用性。例如,發(fā)現(xiàn)存儲設(shè)備硬件組件的故障消息、網(wǎng)絡(luò)傳輸路徑完好與否,以及資源耗用是否達到門檻等,并依照事件的緊要程度提供不同層級的警示等。 更進一階的層次,是幫助改善用戶存儲環(huán)境的使用效率與安全性。例如Dell EMC CloudIQ可以檢測存儲環(huán)境中低利用率的存儲區(qū),提醒用戶回收可用的資源,或是檢測各存儲區(qū)擁有的保護組態(tài)狀態(tài)(鏡像、快照等),提醒管理者各存儲區(qū)的保護設(shè)置是否達到還原點目標需求。 分析預(yù)測與咨詢功能的深度 云計算AI存儲管理平臺的分析預(yù)測與咨詢功能,同樣也能分為不同的層次。 最基本的層次,是提供從存儲環(huán)境整體到個別存儲區(qū),關(guān)于性能與容量使用趨勢分析與預(yù)測。進一步的層次,是通過歷史數(shù)據(jù)的分析,提供性能異常點或熱點的檢測。最后一個層次,是基于存儲資源的使用趨勢,提供升級的指引,HPE Nimble InfoSight、Pure Storage Pure1與Dell EMC CloudIQ幾種功能比較完整的平臺,都能提供從固件版本的升級,到控制器或存儲柜的升級建議。 比較特別的是HPE Nimble InfoSight,除了能提供存儲設(shè)備與存儲區(qū)的分析外,還能進一步分析VM層級的資源使用趨勢,并檢測個別VM的性能異常,分析的深度較其他平臺更深入。 超越存儲范疇的管理能力 云計算AI存儲管理平臺的原始目的,是監(jiān)控與分析用戶環(huán)境的存儲設(shè)備,但已有幾種平臺,提供了監(jiān)控存儲設(shè)備以外設(shè)備的能力,處理的事件范圍更寬廣。 如前所述,HPE Nimble的InfoSight,不僅能管理的Nimble與3PAR兩個系列的存儲設(shè)備,也能管理ProLiant系列服務(wù)器。另外,包括InfoSight,還有Pure Storage的Pure1與Dell EMC CloudIQ,都提供了收集、審查存儲設(shè)備上層運行的VM狀態(tài)功能。 網(wǎng)絡(luò)安全防護考量 一般來說,企業(yè)存儲設(shè)備都是在封閉的內(nèi)部網(wǎng)絡(luò)中運行,但云計算AI存儲管理平臺的運行,是基于用戶端將存儲設(shè)備運行數(shù)據(jù)上傳到云計算數(shù)據(jù)中心,要求存儲設(shè)備打開一個連通云計算的出口,由此衍生的疑慮,便是數(shù)據(jù)上傳作業(yè)的安全性,用戶上傳的數(shù)據(jù)可能外泄,而數(shù)據(jù)上傳的信道也可能成為入侵的渠道。 因此,上傳作業(yè)的網(wǎng)絡(luò)安全防護,也是云計算AI存儲管理平臺架構(gòu)設(shè)計考量的重點,提供了不同層次的防護措施。 首先,用戶端的上傳作業(yè),原則上是通過保密的HTTPS協(xié)議來進行。 其次,用戶上傳的數(shù)據(jù),都是關(guān)于存儲設(shè)備環(huán)境運行的日志與參數(shù)數(shù)據(jù),而非含有用戶運營內(nèi)容的數(shù)據(jù),先天上較不敏感。有一些平臺如NetApp的Active IQ,還提供了讓用戶選擇屏蔽部分環(huán)境參數(shù)、去識別化的功能(如存儲設(shè)備涉及的內(nèi)部網(wǎng)址、與設(shè)備名稱等)。 第三,在用戶端環(huán)境與云計算數(shù)據(jù)中心之間,只有單向從用戶端到云計算的數(shù)據(jù)上傳,而沒有云計算向用戶端存儲設(shè)備回傳數(shù)據(jù)或指令的機制。至于云計算數(shù)據(jù)中心發(fā)給用戶端的各式各樣消息,都是通過云計算管理控制臺接口或郵件來提供。 第四,云計算AI存儲管理平臺的云計算管理控制臺接口,只提供對用戶端環(huán)境的監(jiān)控與后臺分析功能,而不提供設(shè)置與變動存儲組態(tài)的功能,只能被動的審查與分析存儲設(shè)備的數(shù)據(jù),而不能主動下達變動組態(tài)設(shè)置的指令。 除此之外,存儲廠商的云計算數(shù)據(jù)中心,原則上都已通過必要的網(wǎng)絡(luò)安全防護認證(如NetApp與IBM都宣稱通過ISO/IEC 27001認證),也能保障一定程度的安全性。 |
|