一、銀行業(yè)為什么要上云管平臺項目? 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,AI、區(qū)塊鏈、云計算、大數(shù)據(jù)等技術(shù)方興未艾;對于銀行業(yè)來說,在金融科技化變革的浪潮中,如何把握金融科技發(fā)展的脈絡(luò),是立足自身發(fā)展的必由之路。因此銀行業(yè)只有緊隨科技發(fā)展的步伐,不斷提升自己的科技能力,才能應(yīng)對科技日益變化的明天。但銀行業(yè)普遍存在著以下現(xiàn)象: 1、業(yè)務(wù)規(guī)模不斷擴大,設(shè)備保有量不斷增加,設(shè)備的管理難度不斷加大; 2、傳統(tǒng)業(yè)務(wù)的小機池與分布式業(yè)務(wù)的PC池各自分散管理,缺乏有效統(tǒng)一管理;平臺各異、重復(fù)采購、盜版嚴(yán)重; 3、停留在IAAS層面,PAAS層面應(yīng)對乏力,缺少部分場景的靈活性和擴展性; 4、對現(xiàn)有使用設(shè)備缺乏有效的管理手段,豎井建設(shè)、低利用率;導(dǎo)致資源無法有效利用; 5、虛擬化層面部署虛機缺乏有效的批量部署安裝功能以及有效的監(jiān)控;運維分散、專業(yè)化低。 針對以上出現(xiàn)的情況,我們把眼光轉(zhuǎn)向了云計算,云計算作為信息技術(shù)領(lǐng)域的一種創(chuàng)新應(yīng)用模式,具備低成本、彈性、易用、高可靠性、按需服務(wù)等特點,目前云平臺已經(jīng)成為更多行業(yè)用戶的基礎(chǔ)環(huán)境和業(yè)務(wù)承載平臺,越來越多的銀行業(yè)也認(rèn)識到云計算的價值。云平臺最大的價值在于改變了傳統(tǒng)的資源交付模式,實現(xiàn)了 IT 服務(wù)從資源到服務(wù)的轉(zhuǎn)型,其中云管平臺更起到了核心作用。一個好的云管平臺是貼合用戶實際需求的,它在提升 IT 資源利用率的基礎(chǔ)上,實現(xiàn)了資源的統(tǒng)一視圖管理,并且實現(xiàn)了與企業(yè)內(nèi)部流程的融合和交互,最終實現(xiàn)云平臺的自服務(wù)。 同時隨著銀保監(jiān)“十三五”對于云計算架構(gòu)平臺遷移的要求,即到“十三五”末期,面向互聯(lián)網(wǎng)場景的重要信息系統(tǒng)全部遷移至云計算架構(gòu)平臺,其他系統(tǒng)遷移比例不低于60%。因此銀行業(yè)對于云平臺的建設(shè)越顯迫切。 云管平臺實現(xiàn)了對傳統(tǒng)資源交付方式的變革,然而云管平臺的實施也遇到了諸如技術(shù)線路的選擇、異構(gòu)資源(X86 物理機、小型機、 多種虛擬化的虛擬機)的統(tǒng)一納管、管控流程的標(biāo)準(zhǔn)化和個性化之間的差異等問題,諸如以下問題: 1、在故障自愈及彈性伸縮等方面,針對何種故障場景進行自愈,如何進行故障判斷;以及彈性伸縮機制、伸縮機制適合的業(yè)務(wù)類型、是否涉及服務(wù)改造、集群改造等。 2、云平臺的災(zāi)備或雙活建設(shè),面對跨機房型的容災(zāi)或雙活,如何進行建設(shè)部署,是否滿足業(yè)務(wù)要求等。 3、云管平臺的自動化管理先進理念與老舊傳統(tǒng)思維的沖突,大多數(shù)人安于現(xiàn)狀,仍在用傳統(tǒng)的老舊方法來進行全盤管理,雖也能實現(xiàn)效果,但耗費大量的人力物力,滿足不了業(yè)務(wù)的要求,基于此只有從理念上進行改造,糾正人員的思想認(rèn)識,接受云管平臺這一先進管理方法,才能從根本上解決問題。 以及云管平臺異構(gòu)設(shè)備管理、設(shè)備版本不一致、建設(shè)維護成本及技術(shù)儲備等諸多問題。針對以上云管平臺存在的諸多問題,結(jié)合銀行業(yè)自身的云管狀況,在實踐過程中也發(fā)現(xiàn)存在諸如多云或多虛擬化管理等痛點問題。對于多云管理來說出于歷史的設(shè)計,或基于成本考慮,或防止被廠商綁架等原因。 銀行業(yè)實現(xiàn)云管平臺能夠有效整合和利用行業(yè)內(nèi)部多種異構(gòu)資源,統(tǒng)一納管X86、power及其它虛擬化,簡化內(nèi)部IT架構(gòu),實現(xiàn)設(shè)備的全生命周期管理,消除設(shè)備使用信息孤島,降低運維和管理成本;同時,結(jié)合云平臺提供的自服務(wù)能力,能有效的提供設(shè)備自動化、批量化部署;應(yīng)用自動化、流程化安裝;第三方服務(wù)目錄標(biāo)準(zhǔn)化、接口化對接;計算、存儲及網(wǎng)絡(luò)資源的可靠性、冗余性保護;故障自愈、彈性伸縮等多項功能并駕齊驅(qū);全面的安全資源池保駕護航。 二、銀行業(yè)上云管平臺項目的多嗎?現(xiàn)在是什么形勢? 云管平臺能解決銀行中存在的特定問題,符合銀行監(jiān)管的要求,也能貼合銀行的需求,因此就整個銀行業(yè)來說,云管平臺在大部分銀行都已經(jīng)鋪開。大的銀行早已經(jīng)建設(shè)完成并投入使用多年,中型銀行也已經(jīng)完成云管平臺建設(shè)并開始投入使用,而部分中小型銀行則在不斷調(diào)研,收集云管平臺項目的需求,為云管平臺的建設(shè)做好前期的準(zhǔn)備工作,就整體情況而言,60%-70%的銀行都已經(jīng)在使用云管平臺。 就云管平臺項目在不同的銀行中進展情況不同,究其原因如下: 1、 各個銀行規(guī)模不同,因為銀行存貸款規(guī)模不同,當(dāng)達到一定的規(guī)模時,就會遇到虛擬化無法解決的問題,因此大的銀行在比較早的時間點就開始考慮云管平臺來解決一系列存在的問題,而中小型銀行由于先天的規(guī)模限制,導(dǎo)致起步較晚。 2、 各個銀行投入不同,對于大的銀行來說,其技術(shù)人員較多,水平較高,對于技術(shù)的投入也比較多,因此人力財力都具備了,所以大的銀行較早的上馬該項目,并不斷地投入人力物力來完善和豐富;而對于中小銀行來說,人力和財力都不是那么充分,要考慮各類的預(yù)算支出,因此造成偏慢的局面。 3、 各個銀行對新技術(shù)看法不同,自云管平臺誕生以后,其理念在業(yè)界不斷發(fā)酵和深化,各銀行對此項新技術(shù)的看法不盡相同。有的偏向于保守先觀望,看看別的銀行是如何做的;有的偏向于擁抱新技術(shù),研究云管平臺能解決存在的問題和帶來的好處進行綜合比較,并開始著手調(diào)研后進行建設(shè);有的則處于兩者之間,在調(diào)研但沒開始著手去做。故帶來不同的進展情況,也有些小的銀行走在部分中型銀行之前。 基于以上幾點考慮,對于銀行業(yè)來說,云管平臺項目不斷在推進,持續(xù)在建設(shè),努力在深化,在不久的將來可以預(yù)見到每家銀行都會擁有自己的云管平臺,在云的世界里向每個客戶普及金融的樂趣。 三、銀行業(yè)如何評估云管平臺項目的整體成本? 在明確了云管平臺項目的需求之后,就必須考慮如何建設(shè)好云管平臺;對于云管平臺的技術(shù)選型及相應(yīng)的成本分析是之后建設(shè)的重點。因為只有確定好合適的技術(shù)路線才能確保實現(xiàn)制定的各項需求。對于云管平臺的建設(shè)無外乎采用如下三點技術(shù)路線: 1、 購買廠家成熟的云管平臺產(chǎn)品;對于大多數(shù)技術(shù)積累不夠的銀行來說,購買廠家成熟的云管平臺產(chǎn)品是快速建設(shè)云管平臺的一條捷徑。對于大多數(shù)銀行來說人力早已捉襟見肘了,而購買云管平臺產(chǎn)品不需要投入較多的人力成本來建設(shè)和維護,因此對于該點的成本分析著重說明如下。 1.1 物理硬件成本:包含云管平臺搭建的服務(wù)器、網(wǎng)絡(luò)設(shè)備等直接成本,如銀行有現(xiàn)成的服務(wù)器和網(wǎng)絡(luò)設(shè)備等,則可以直接拿來進行使用;如無則需要進行單獨的采購,其中服務(wù)器和網(wǎng)絡(luò)設(shè)備配置需滿足云管平臺的要求。這里的物理硬件成本根據(jù)銀行對于云管平臺需求的數(shù)量而定,成本有高有低。 1.2 云管平臺成本:對于向廠家采購的云管平臺是需要按CPU或存儲容量進行單獨收費的,在采購之前需弄清自身的需求,對于云管平臺上需要的虛機是要多少量,從而去估算服務(wù)器和網(wǎng)絡(luò)設(shè)備的數(shù)量,再根據(jù)服務(wù)器的數(shù)量去估算要購買的云管平臺license的數(shù)量,對于數(shù)量要求比較多的可以同廠家進行洽談至不限數(shù)量使用,但價格相比固定數(shù)量的會略高一點。大致成本在100萬-120萬左右,除去物理硬件成本,該項支出占總成本的50%-60%左右。 1.3 定制化開發(fā)成本:對于廠家現(xiàn)成的云管平臺,如果想要進行相應(yīng)的流程開發(fā)或同自身的其它系統(tǒng)(諸如告警系統(tǒng)、流程系統(tǒng)、大屏展示系統(tǒng)等)進行對接,這就需要進行定制化開發(fā),因此就需要一個定制化開發(fā)的成本。定制化開發(fā)的成本根據(jù)需要定制化開發(fā)的內(nèi)容量來進行估算,大致成本是根據(jù)開發(fā)量按人月4萬-5萬來進行估算的,按開發(fā)量的大小來算該項支出占總成本的10%-20%左右。 1.4 維保服務(wù)成本:對于云管平臺來說,出現(xiàn)問題則需要相應(yīng)的維保服務(wù)來進行解決,因此對于銀行來說,維保服務(wù)成本也是必須的,這樣出現(xiàn)問題也能及時進行解決,維持云管平臺的健康穩(wěn)定。大多數(shù)情況下會贈送一年的免費維保,維保過期后需購買后續(xù)的維保服務(wù),維保服務(wù)的大致成本為一年40萬-50萬,該項占總成本的15%-20%左右。 1.5 駐場服務(wù)成本:對于大型的云管平臺的落地,僅靠維保服務(wù)是無法滿足銀行業(yè)的要求,這時云管平臺廠家的駐場服務(wù)就成了一個可選項。以專業(yè)的駐場人員來全流程維護云管平臺,負(fù)責(zé)云管平臺的運營和運維。但對多數(shù)小型的云管平臺項目來說,駐場服務(wù)是可有可無的。因為平臺大多數(shù)時間都是穩(wěn)定的,即使有問題通過維保服務(wù)也能及時解決。駐場服務(wù)的大致成本為一人一年40萬-50萬左右。 2、 采用開源的云管平臺框架進行定制化開發(fā);對于有技術(shù)研發(fā)能力的銀行來說,通過開源的云管平臺(諸如OpenStack等)為基礎(chǔ)來定制化開發(fā)適合該行的云管平臺。其中涉及的主要成本是開發(fā)人員的人工成本以及后期的維護成本,對銀行的開發(fā)人員自身技術(shù)要求也比較高。對于這種自研自用的云管平臺來說,因為涉及的面比較廣,既有計算、存儲、網(wǎng)絡(luò)虛擬化等,其上又有云管等,投入的人員成本也會很高,后期的維護成本同樣也會如此。 3、 自己研發(fā)云管平臺,對于大多數(shù)銀行來說,如果說技術(shù)積累不是很雄厚的話,是無法通過自身的技術(shù)力量去單獨開發(fā)一個云管平臺,其前期投入的成本也會很高,研發(fā)出來的產(chǎn)品性能或許和開源的云管平臺產(chǎn)品不相上下,這就容易造成資源浪費,所以這里不再詳細(xì)說明。 四、在銀行云管平臺項目中,如何進行技術(shù)路線的選擇? 在云時代高速發(fā)展的推動下,對于傳統(tǒng)銀行如何進行云化變革,如何進行上云技術(shù)路線選型,依然存在不少的疑惑。云管平臺選型方向不多,但隨著不同銀行對于云管平臺要求實現(xiàn)涵蓋范圍的不同,其部署的難度、實現(xiàn)效果也不同,因此對于技術(shù)路線的選擇顯得很重要。 因此,根據(jù)自身云化業(yè)務(wù)規(guī)模建議選取業(yè)內(nèi)比較成熟的技術(shù)框架,下面對具體技術(shù)路線的選型詳細(xì)分類說明。 1、開源技術(shù)方面 隨著云管技術(shù)多元化的發(fā)展和國產(chǎn)化趨勢的推動,銀行云管平臺項目建設(shè)把目光轉(zhuǎn)到開源技術(shù)架構(gòu)。國內(nèi)云管平臺使用較多的技術(shù)框架是OpenStack,OpenStack是一個開源的云計算管理平臺項目,由幾個主要的組件組合起來完成具體工作。OpenStack支持幾乎所有類型的云環(huán)境,項目目標(biāo)是提供實施簡單、可大規(guī)模擴展、豐富、標(biāo)準(zhǔn)統(tǒng)一的云計算管理平臺。OpenStack通過各種互補的服務(wù)提供了基礎(chǔ)的IaaS解決方案,每個服務(wù)提供API進行集成。OpenStack覆蓋了網(wǎng)絡(luò)、虛擬化、操作系統(tǒng)、服務(wù)器等各個方面,然而其不是一個產(chǎn)品,其在嚴(yán)格生產(chǎn)應(yīng)用過程前必須經(jīng)過優(yōu)化,但OpenStack提供了一種優(yōu)秀的IT模型和框架,銀行業(yè)可以通過OpenStack量身定制私有云。 中國銀聯(lián)是金融行業(yè)最早介入云計算領(lǐng)域,通過三年云計算落地建設(shè),打造出金融行業(yè)第一朵云。截至目前,基于OpenStack建設(shè)的私有云已經(jīng)穩(wěn)定運行1000多天,平臺累計具備了11960vCPU、33280G內(nèi)存和600TB企業(yè)級存儲計算力,初步建成了包括云資源管理平臺(IaaS)、云集成開發(fā)平臺(PaaS)、智能支付終端平臺(SaaS)等在內(nèi)的云計算基礎(chǔ)平臺和應(yīng)用平臺。其它國有大行基于OpenStack的云平臺如雨后春筍般全面鋪開,但對于中小銀行來說,自身科技力量比較薄弱,而基于OpenStack的云平臺建設(shè)上需投入很大的人力和物力,因此基于此銀行要根據(jù)自身的能力來量力而行。 2、聯(lián)合開發(fā) 這種模式一方面可以更好的滿足行內(nèi)各種實際需求,另一方面可以充分利用廠商的專業(yè)技術(shù)能力,但這種研發(fā)沒有固定模式可尋,建設(shè)周期相對較長,因此不太適合大部分銀行進行云管平臺部署。 3、產(chǎn)品購買 由于中小銀行自身科技能力有限,因此偏向于市面上成熟化的云管平臺產(chǎn)品,這種模式建設(shè)周期相對較短,在進行本行落地定制化的過程中有相應(yīng)的應(yīng)用案例參考,一般建設(shè)周期相對較短,定制研發(fā)多以落地為主,技能要求相對較低,選擇時建議選擇相對開放易于定制的產(chǎn)品。市面上大多數(shù)成熟化的云管平臺都是基于OpenStack進行優(yōu)化開發(fā)而成,因此技術(shù)路線也是基于OpenStack的,比如華三云和華為云等。 因此在進行云管平臺技術(shù)路線選擇時,需要綜合考慮平臺的建設(shè)目標(biāo)、投入成本、團隊技術(shù)儲備、所選技術(shù)路線的成熟度、生態(tài)圈發(fā)展情況及其未來發(fā)展趨勢等多種因素。但市面上能選擇的技術(shù)路線不多,主要是以O(shè)penStack技術(shù)路線為主。 五、在銀行業(yè)中,云管平臺項目的供應(yīng)商有哪些? 對于銀行業(yè)來說,云管平臺的建設(shè)涉及的模塊比較多,因此涉及各模塊相關(guān)的供應(yīng)商也比較多,下面就整個云管平臺項目的供應(yīng)商進行簡要的說明。 就云管平臺項目而言,可以分為純云管項目和包含底層虛擬化的云管項目來進行說明。 1、 包含底層虛擬化的云管平臺。對于這種形式的云管平臺建設(shè)來說,是從無到有進行建設(shè)和部署。首先底層的虛擬化需要通過服務(wù)器來進行搭建和部署,部署方式可分為集中式部署和分布式部署。對于服務(wù)器采購來說,市面上主要的服務(wù)器供應(yīng)商主要有:華為、聯(lián)想、惠普、浪潮、曙光、華三等幾家;主流的2路服務(wù)器型號主要有:華為VH2288V5、聯(lián)想SR650、惠普DL380G10、浪潮NF5280M5等。服務(wù)器內(nèi)部的CPU、內(nèi)存及硬盤各家基本類似,測試下來對比的性能都差不多。對于集中式部署還需要采購存儲,市面上存儲供應(yīng)商的主要有:EMC(DMX或VNX)、IBM(V9000)、惠普(3Par)、華為(OceanStor)等幾家;而對于分布式部署,則分為融合型部署和分離式部署(即分為計算節(jié)點和存儲節(jié)點),不需單獨采購集中式存儲,只需使用服務(wù)器自帶的磁盤即可滿足。此外還需要網(wǎng)絡(luò)設(shè)備(包含SDN設(shè)備),主要供應(yīng)商有:思科、華為及華三這幾家。在服務(wù)器、存儲及網(wǎng)絡(luò)設(shè)備部署之后即完成底層虛擬化的搭建,此后就可部署云管平臺。 2、 純云管平臺項目。云管平臺主要有華三、華為、VMware、青云、博云等幾家,下面對這幾家的云管平臺產(chǎn)品進行簡要說明。就銀行業(yè)來說,由于人行和銀監(jiān)監(jiān)管的需要,對于安全的考慮必須放在首位。因此就銀行業(yè)來說,私有云的建設(shè)是云管平臺部署的主要方向,對于青云、博云來說主要是偏向公有云方向;VMware云管平臺主要是外企產(chǎn)品,性能也能滿足需求,也比較貼合底層的VMware虛擬化,但在個性化定制和系統(tǒng)對接方面略顯不足;而對于國產(chǎn)的華為、華三兩家云平臺而言,都含底層的虛擬化、分布式存儲及云平臺一系列產(chǎn)品,性能兩家測試下來也不相上下,具備客戶定制化流程及相關(guān)系統(tǒng)對接能力。 此外如果對于技術(shù)能力比較強的銀行來說,可以通過自身技術(shù)研發(fā)或通過開源云平臺(比如OpenStack)進行相應(yīng)的開發(fā),這里就不涉及相應(yīng)的云管平臺的供應(yīng)商。 六、在銀行云管平臺項目中,如何進行云管產(chǎn)品的選型? 對于云管平臺項目來說,云管產(chǎn)品的選型是整個項目中最重要的一環(huán),因為云管平臺選型的好壞關(guān)乎整個云管平臺項目是否能滿足當(dāng)初制定的各項需求、能否滿足功能要求、能否滿足平臺性能指標(biāo)及能否滿足平臺安全可靠的要求等。此外云管平臺項目還涉及底層物理環(huán)境、網(wǎng)絡(luò)設(shè)備、虛擬化方式、SDN等產(chǎn)品的選型,但就云管產(chǎn)品來說是部署在這些產(chǎn)品之上的,直接向客戶展示平臺界面,客戶從平臺界面上能夠直觀的感受平臺的各項功能展示,對平臺的功能和性能都有很清晰的了解,因此云管產(chǎn)品的選型需格外重視。 由于云計算技術(shù)的快速發(fā)展,銀保監(jiān)“十三五”規(guī)劃對于銀行上云有了清晰的規(guī)劃及銀行自身業(yè)務(wù)的發(fā)展,這些使得銀行業(yè)對于云管技術(shù)越來越感興趣。對于銀行業(yè)來說,云管產(chǎn)品的選型要貼合行內(nèi)自身的需求,能實際解決行內(nèi)存在的各種痛點問題。因此在產(chǎn)品的選型之前,需要理清行內(nèi)對于云管產(chǎn)品的各項訴求,特別是要抓住一些核心訴求。 1、云管平臺在銀行信息化過程中有著獨立的平臺定位和使命。因為銀行業(yè)自身業(yè)務(wù)的發(fā)展或早或晚都將面臨著幾個關(guān)鍵技術(shù)挑戰(zhàn),即資源服務(wù)化、資源全生命周期管理和異構(gòu)管理及多云對接。這三個挑戰(zhàn)共同需要一個獨立的平臺出現(xiàn)——即獨立云管平臺。 資源服務(wù)化:如果需要對銀行內(nèi)部各種資源進行服務(wù)化,那就需要一個獨立的用戶/租戶體系,這個用戶/租戶體系需要超越現(xiàn)有資源自帶的用戶/租戶體系。這就是獨立云管平臺一個重要的產(chǎn)品特征。但銀行內(nèi)部不同產(chǎn)品及能力在服務(wù)化支持能力上參差不齊,這就要求云管平臺能夠針對不同產(chǎn)品及能力的現(xiàn)狀建立合適的資源服務(wù)化模式,而獨立云管平臺則可以保障這個模式得以靈活構(gòu)建。 資源全生命周期管理:銀行內(nèi)部的資源形態(tài)多樣化,有X86服務(wù)器、小機這樣的傳統(tǒng)設(shè)備,也有VMware虛擬化、KVM虛擬化等虛擬化設(shè)備,還有備份、監(jiān)控、安全等運維相關(guān)系統(tǒng)。每種產(chǎn)品及能力因其定位不同,側(cè)重的場景不同,其生命周期管理模式也不同。而云管平臺需要能夠提供足夠的擴展能力,讓不同資源的生命周期管理模式在其框架內(nèi)實現(xiàn)。 異構(gòu)管理及多云對接:銀行內(nèi)部的資源異構(gòu)主要來自于兩個方面,一是銀行資源的演化和迭代是一個長期的過程,這就意味著不同階段的產(chǎn)品會在長時間進行共存。最為典型的現(xiàn)象就是很多企業(yè)內(nèi)部資源會同時存在有小型機、X86服務(wù)器、X86虛擬化等。因為這個原因,綁定一種產(chǎn)品及能力的云管平臺很難承擔(dān)起整個企業(yè)資源能力云化的使命。 2、云管平臺在銀行信息化轉(zhuǎn)型過程中需要有獨立的持續(xù)演化能力。由于云管平臺的特殊定位,它一方面需要面向最終業(yè)務(wù)用戶,另外一方面需要連接大量云服務(wù)。 針對以上銀行對云管產(chǎn)品訴求的分析,結(jié)合銀行自身的實際情況,對市面上主流的云管產(chǎn)品進行分析。由于云管平臺項目涉及的東西較多,不光有云管產(chǎn)品,還有服務(wù)器、底層虛擬化技術(shù)、硬件SDN設(shè)備、網(wǎng)絡(luò)設(shè)備、安全設(shè)備等。因此針對整個項目通盤進行考慮(這里服務(wù)器的耦合度不大,故可以排除在外),是將云管平臺項目按以上模塊進行拆分,各自選擇廠商;還是選擇一家技術(shù)能力較強,產(chǎn)品線全面的廠商。對于以上兩個方向進行綜合考慮,按模塊拆分確實可以選擇各模塊水平排名靠前的廠商,但模塊對接時需要各廠商進行相應(yīng)的對接,這就需要對相應(yīng)的廠商進行良好的溝通,相應(yīng)接口的對接,問題排查的處理等。而一家廠商可以解決以上協(xié)調(diào)的問題,但又存在著該廠商的某個模塊相比其它專門做這個模塊的廠商存在技術(shù)的差別。基于全面通盤的考慮,還是偏向于選擇一家廠商來實施云管項目。有了這個思路,我們對市面上滿足要求的廠商進行調(diào)研和溝通,發(fā)現(xiàn)滿足的廠商不多,主要有華三和華為兩家。 首先這兩家廠商的技術(shù)比較雄厚,產(chǎn)品線也比較多,有各自的服務(wù)器、網(wǎng)絡(luò)設(shè)備、硬件SDN設(shè)備及云管平臺產(chǎn)品;在產(chǎn)品線上也貼合云管平臺項目各模塊的要求。在功能上具備統(tǒng)一的用戶/租戶體系、完整的權(quán)限管理體系、完備的API訪問接口、靈活的插件體系及模塊化的快速擴展能力。能夠滿足資源服務(wù)化、資源全生命周期管理及異構(gòu)管理及多云對接等核心訴求;同時還具備充分的客戶定制化能力和平臺對接能力;能夠滿足云管平臺項目的各項需求。但兩家在納管異構(gòu)資源的方式和操作界面上有所不同。 七、在銀行云管平臺項目中,涉及新購或擴容改造的產(chǎn)品、資源有哪些? 對于一個完整的云管平臺項目來說,涉及的產(chǎn)品模塊比較多,有服務(wù)器設(shè)備、網(wǎng)絡(luò)設(shè)備、硬件SDN設(shè)備、云管平臺產(chǎn)品等;此外如果還需個性的定制化,比如流程的開發(fā)、第三方系統(tǒng)的對接等,就需要有定制化開發(fā)服務(wù);對于云管平臺項目來說,還需要考慮平臺的維保服務(wù),以便有問題發(fā)生時及時介入處理;如果是屬于大型的運營類云管平臺,還需要有專門的駐場服務(wù)來負(fù)責(zé)整個平臺的運營。下面是一份完整的服務(wù)采購清單。 八、在銀行云管平臺項目中,如何進行定量需求分析?需要收集哪些需求數(shù)據(jù)信息? 在云管項目中,需求分析是平臺部署的先決條件,只有理清了平臺的需求,才能更好地為后續(xù)建設(shè)服務(wù)。需求分析可分為問題識別、分析與綜合、編制需求分析文檔、需求評審等四個階段,包括以下幾個方面:確定平臺所期望的用戶類;獲取每個用戶的需求;了解實際用戶任務(wù)和目標(biāo)以及這些任務(wù)所支持的業(yè)務(wù)需求;分析用戶的信息以區(qū)別用戶任務(wù)需求、功能需求、業(yè)務(wù)規(guī)則、質(zhì)量屬性、建議解決方法和附加信息;將平臺的需求劃分子系統(tǒng),并確定平臺的功能和性能屬性;討論得出平臺部署優(yōu)先級;將所收集的用戶需求編寫成需求規(guī)格說明和模型;評審需求規(guī)格說明,確保與用戶達成共識。 1、問題識別:首先理清云管平臺項目為什么做,能不能做,值不值得做,做到什么程度。需求包括:功能、性能、環(huán)境、可靠性、安全性、保密性、監(jiān)控、展示、用戶界面、資源使用、成本、進度等。銀行云管平臺的建設(shè),不僅需要為基于異構(gòu)化設(shè)備提供運行和管控平臺之外,還必須非常重視滿足金融行業(yè)嚴(yán)苛的監(jiān)管和安全要求。這樣的定位決定了在銀行建設(shè)云管平臺除了要具備市場上大多數(shù)云管平臺產(chǎn)品的能力,還需為銀行的特殊監(jiān)管需求進行定制。 2、分析與綜合:以云管平臺項目的數(shù)據(jù)流和業(yè)務(wù)流為出發(fā)點,逐步細(xì)化所有的平臺功能,找出各模塊之間的聯(lián)系、接口特性和設(shè)計上的限制,分析它們是否滿足功能要求和性能要求,綜合成平臺的整體解決方案,給出平臺的詳細(xì)邏輯架構(gòu)和物理架構(gòu),主要的需求分析步驟如下: (1)用戶需求的目標(biāo)分析; 通過前面的問題識別,明確云管平臺項目要實現(xiàn)的功能;并根據(jù)用戶提出的需求進行目標(biāo)分析,建議考慮包括的方面有:云管平臺統(tǒng)一納管異構(gòu)資源(X86 物理機、小型機、 虛擬機);滿足金融監(jiān)管和安全要求;支持銀行應(yīng)用發(fā)布體系、高可用管理策略;對接底層異構(gòu)資源池,遵從云計算資源的統(tǒng)一管理和分配;實現(xiàn)部分業(yè)務(wù)的動態(tài)擴展需求的場景;滿足操作系統(tǒng)、應(yīng)用、第三方功能服務(wù)化,提供標(biāo)準(zhǔn)API接口。實現(xiàn)多租戶管理,各租戶之間邏輯隔離;同時還需具備應(yīng)用自動化、彈性擴容等高級特性來滿足現(xiàn)有業(yè)務(wù)需求等。因此這里需要考慮的數(shù)據(jù)信息有:云管平臺的整體規(guī)模大小、要實現(xiàn)的具體功能、定制化開發(fā)的內(nèi)容要求、是否對接第三方系統(tǒng)等。 (2)邏輯架構(gòu)圖、物理架構(gòu)圖、網(wǎng)絡(luò)架構(gòu)圖; 邏輯架構(gòu)圖、物理架構(gòu)圖及網(wǎng)絡(luò)架構(gòu)圖的說明,是項目組通過與用戶進行溝通與訪談后,對用戶需求的在架構(gòu)上進行結(jié)構(gòu)化和分解化的結(jié)果。項目組首先以邏輯的結(jié)構(gòu)將整個云管平臺項目進行結(jié)構(gòu)分解,并通過業(yè)務(wù)流的形式將各個模塊進行業(yè)務(wù)耦合,以邏輯架構(gòu)和網(wǎng)絡(luò)架構(gòu)的形式向客戶展示整個云管平臺的架構(gòu)、各模板之間的交互、業(yè)務(wù)流的走向、網(wǎng)絡(luò)的集成拓?fù)洹?/span>明確了邏輯架構(gòu)之后是將整個架構(gòu)在物理實施上進行再次細(xì)化,將要實現(xiàn)的功能細(xì)化在物理結(jié)構(gòu)上,是對需求落地的通盤考慮,也是對邏輯架構(gòu)的再次驗證。這里需要收集的數(shù)據(jù)信息有:云管平臺整體規(guī)模轉(zhuǎn)換到的服務(wù)器的數(shù)量、服務(wù)器及網(wǎng)絡(luò)設(shè)備機房如何部署、相關(guān)地址的規(guī)劃及命名規(guī)則、云管平臺部署的方式、網(wǎng)絡(luò)整體架構(gòu)的方式、網(wǎng)絡(luò)引流的方法、安全防護措施如何部署等。 (3)云管平臺設(shè)計; 在完成之前底層的邏輯、網(wǎng)絡(luò)及物理架構(gòu)設(shè)計之后,就到了云平臺設(shè)計階段,對于云管平臺項目來說,云管平臺的好壞關(guān)乎著整個項目的走向,因此對于云管平臺的設(shè)計需要考慮如下信息:云管平臺要實現(xiàn)的哪些功能、是否需要對接現(xiàn)有的第三方系統(tǒng)、是否需要部署監(jiān)控系統(tǒng)、監(jiān)控系統(tǒng)是否要同現(xiàn)有監(jiān)控系統(tǒng)打通、是否要流程管理、流程管理涉及哪些業(yè)務(wù)流、流程過程中是否需要短信對接、平臺虛機是要需要備份、要備份如何進行備份、備份的策略又是怎樣、云管平臺是否需要部署防病毒服務(wù)器、云管平臺是否需要等保評級、上面的虛機是否也要進行等保、虛機是否需要進行計費、是否需要收費、是否要進行分租戶的方式進行管理、租戶之間是否需要隔離等。 (4)平臺可用性指標(biāo); 根據(jù)用戶要求,需要對云管平臺高可靠性、兼容性、并發(fā)IOPS數(shù)、系統(tǒng)響應(yīng)時間和可用性指標(biāo)進行明確,并得到用戶認(rèn)同。因此需要收集如下信息:云管平臺高可靠性是否要達到99.9%還是99.99%,上面的虛機是否兼容各個操作系統(tǒng)的版本、并發(fā)IOPS數(shù)是否滿足用戶需求、系統(tǒng)響應(yīng)時間是否滿足要求、可用性指標(biāo)是否滿足要求以及云管平臺是否支持災(zāi)備或雙活架構(gòu)等。 3、編制需求分析文檔 根據(jù)以上的分析與綜合,梳理以上的需求數(shù)據(jù)信息進行整理歸納并按照相應(yīng)的格式編制出需求分析文檔。 4、需求評審 對整理好的需求分析文檔提交給相應(yīng)的管理部門召開相應(yīng)的人員對云管平臺的需求分析報告進行需求評審,確定需求是否合理,是否貼合實際情況,是否能帶來很大便利等,從多方面進行綜合考量。 九、如何規(guī)劃銀行云管平臺項目的工程實施步驟? 對于一個完整的云管平臺項目建設(shè)來說,主要分為:啟動階段、規(guī)劃階段、實施階段及驗收階段。下面對這四個不同的階段做詳細(xì)的說明。 1、啟動階段: ·項目立項申請; ·組建項目組(任命項目經(jīng)理及技術(shù)經(jīng)理、確認(rèn)項目成員); ·收集項目信息; ·舉行內(nèi)部項目啟動會; ·舉行外部項目啟動會。 2、規(guī)劃階段: ·制定并刷新《項目交付計劃》; ·制定硬件互聯(lián)方案(設(shè)備供電環(huán)境及安裝位置確認(rèn)、各設(shè)備功率計算、繪制設(shè)備機柜位置圖、設(shè)備接口連線及條線長度數(shù)量確認(rèn)); ·制定《項目實施方案》; ·制定《項目測試方案》; ·各組件軟件版本確認(rèn)等。 3、實施階段: ·服務(wù)器及網(wǎng)絡(luò)設(shè)備到貨:設(shè)備上架及加電、設(shè)備拉線及標(biāo)簽整理;服務(wù)器固件檢查如不符合需要進行固件版本升級;服務(wù)器管理口配置。 ·基礎(chǔ)環(huán)境配置及調(diào)試:包括配置及調(diào)試管理網(wǎng)、業(yè)務(wù)網(wǎng)、存儲網(wǎng)絡(luò)、網(wǎng)絡(luò)出口網(wǎng)絡(luò)等。 ·軟件系統(tǒng)安裝及部署:包括計算虛擬化軟件安裝、存儲虛擬化軟件安裝、SDN控制器安裝部署、云平臺安裝部署。 ·軟硬件聯(lián)調(diào)及云管平臺對接:包括多平臺聯(lián)調(diào)、多租戶調(diào)試、審批流程調(diào)試及網(wǎng)絡(luò)安全調(diào)試。 ·云平臺功能測試 ·整體功能測試 ·云平臺性能測試 ·定制化開發(fā):包括需求階段(需求調(diào)研、需求確認(rèn)、需求評審、需求規(guī)格)、設(shè)計階段(UI設(shè)計、交互設(shè)計、數(shù)據(jù)庫設(shè)計、軟件概要設(shè)計)、開發(fā)階段(前端代碼開發(fā)、后端代碼開發(fā)、UT&IT、對接聯(lián)調(diào)及系統(tǒng)測試)和部署上線及維護(軟件部署、驗收測試、上線前測試及軟件試運行)這四個階段。 4、驗收階段: ·驗收材料匯編; ·項目驗收測試; ·項目技術(shù)培訓(xùn); ·項目試運行; ·驗收文檔簽收。 對于整個云管平臺的建設(shè)過程來說,存在的難點主要有: 1、溝通難點:由于項目相關(guān)參與方較多,可能因復(fù)雜關(guān)系及利益存在影響項目溝通效率;開發(fā)定制化涉及需求規(guī)格及軟件設(shè)計的需求傳遞,需要雙方及時溝通確認(rèn);云管平臺與第三方系統(tǒng)對接的適配等。這些問題可能會給項目的進度和范圍管理帶來很大的麻煩,基于此問題,通過充分的干系人分析、調(diào)研及溝通,充分的需求調(diào)研等方式來加強溝通。 2、安全難點:對于要面向互聯(lián)網(wǎng)業(yè)務(wù)的云管平臺來說,是需要同外網(wǎng)進行交互的,就銀行來說這就需要格外注重平臺的安全性。因為安全防護的好壞關(guān)乎其上業(yè)務(wù)能否正常運行,如其上的業(yè)務(wù)動不動就被人攻擊對整個平臺來說是災(zāi)難性的。因此對于安全這個難點問題,經(jīng)過充分考慮,建議建立一個專門的安全資源池(通過X86服務(wù)器進行部署),在上面部署防火墻、WAF、IPS等一系列市面上常用的安全防護軟件,通過引流的形式將面向互聯(lián)網(wǎng)業(yè)務(wù)的流量在安全資源池里進行清洗,充分保證業(yè)務(wù)的安全性。 十、如何解決銀行云管平臺項目中的監(jiān)控整合難點問題? 對于銀行業(yè)來說,云管平臺項目建設(shè)完成之后就需要部署平臺的監(jiān)控軟件,以便對云管平臺現(xiàn)有資源進行監(jiān)控。由于云管平臺有自身的一套運維監(jiān)控系統(tǒng),但與企業(yè)原有的其它監(jiān)控軟件來說相對獨立,無法整合。這就造成了一個中心兩套監(jiān)管系統(tǒng)的尷尬局面,運維人員不得不在兩個監(jiān)控界面上來回切換進行監(jiān)控。原有的監(jiān)控軟件由于建設(shè)較早,覆蓋面也比較廣,涉及的系統(tǒng)也比較多,在一些功能上也所有優(yōu)化;同時也關(guān)聯(lián)著告警工單系統(tǒng)、短信提醒等多種措施。但由于新部署的云管系統(tǒng)監(jiān)控軟件相對于傳統(tǒng)的監(jiān)控軟件來說相對獨立,無法有效地生成告警事件單及短信提醒,造成告警事情處理不及時,影響平臺的穩(wěn)定性和可靠性,同時也可能造成業(yè)務(wù)故障影響。這也是對多家中心銀行帶來的痛點問題,因為對于銀行來說,監(jiān)控的范圍要覆蓋到每一套系統(tǒng),絕不允許“燈下黑”的現(xiàn)象發(fā)生。 對于該問題的產(chǎn)生,主要是由于兩套監(jiān)控軟件相對獨立,傳統(tǒng)的監(jiān)控軟件位于生產(chǎn)網(wǎng)段區(qū),而云管平臺監(jiān)控軟件位于帶外管理區(qū),兩套網(wǎng)絡(luò)邏輯隔離,互不相通。而要想實現(xiàn)傳統(tǒng)監(jiān)控軟件相應(yīng)的告警處理機制,這就要求云管平臺監(jiān)控軟件也需要同工單系統(tǒng)、短信貓等系統(tǒng)也需要進行對接處理。要想實現(xiàn)兩套監(jiān)控軟件的整合需要對接的系統(tǒng)較多,耗費的工作量也較大,對于部分中小銀行來說仍維持現(xiàn)狀,兩套監(jiān)控軟件同時進行監(jiān)控運維,但云管平臺的監(jiān)控軟件監(jiān)控力度有所薄弱。 基于兩套監(jiān)控軟件并存的現(xiàn)狀出發(fā),我們分析解決該問題的幾種思路: 一、重新部署一套新的監(jiān)控軟件,能夠整合傳統(tǒng)的監(jiān)控軟件和云管平臺監(jiān)控軟件,由于兩套系統(tǒng)部署在兩個網(wǎng)絡(luò)隔離的網(wǎng)段中,重新部署需要面臨著網(wǎng)絡(luò)的問題,同時重新部署需要耗費大量的人力和財力去采購新的監(jiān)控軟件,去整合現(xiàn)有的各種監(jiān)控指標(biāo),這不亞于對現(xiàn)有的監(jiān)控進行推倒重來,故此想法可行性不大。 二、將某一套監(jiān)控軟件整合到另一套監(jiān)控軟件中,形成一個統(tǒng)一的監(jiān)控系統(tǒng)。由于傳統(tǒng)的監(jiān)控軟件運行多年,對接的工單、短信系統(tǒng)也已經(jīng)使用多年,故將云管平臺監(jiān)控軟件整合到傳統(tǒng)的監(jiān)控軟件中工作量相比就少很多。同樣基于整合便捷的考慮,也不必讓云管平臺監(jiān)控軟件去對接其它第三方系統(tǒng),利用傳統(tǒng)監(jiān)控軟件對接第三方系統(tǒng)成熟的便利性就傳統(tǒng)監(jiān)控軟件進行接口打通,將云管平臺監(jiān)控軟件告警推送至傳統(tǒng)監(jiān)控軟件上,利用傳統(tǒng)監(jiān)控軟件來生產(chǎn)工單及短信告警。這就極大節(jié)省工作量,只需將告警信息推送至傳統(tǒng)監(jiān)控上即可。 針對以上思路的綜合考慮,決定采用第2種方法來進行監(jiān)控整合。 1、將傳統(tǒng)監(jiān)控軟件對接的API接口提取出來發(fā)給云管平臺監(jiān)控軟件方人員,尤其對告警信息接口對接,進行告警信息的推送。 2、由于兩套監(jiān)控軟件網(wǎng)段邏輯隔離,部署一臺虛機配置兩塊網(wǎng)卡,分別與兩套網(wǎng)段進行相通,起到跳板機的作用,解決網(wǎng)絡(luò)隔離的問題,并在跳板機上部署相應(yīng)的推送程序。 3、將云管平臺監(jiān)控軟件上的告警信息通過跳板機推送到傳統(tǒng)監(jiān)控軟件上,在傳統(tǒng)監(jiān)控軟件上進行告警顯示,工單生成及短信提醒等后續(xù)告警手段。 通過以上方式將云管平臺監(jiān)控軟件的告警信息推送整合到傳統(tǒng)監(jiān)控軟件上,使運維人員可以在傳統(tǒng)監(jiān)控軟件上直觀地查看兩套監(jiān)控軟件的告警信息,及時有效地處理各類告警信息,避免監(jiān)控的死角及“燈下黑”。做到監(jiān)控有的放矢,保障系統(tǒng)穩(wěn)定可靠。 十一、在銀行云管平臺項目中,SDN模塊如何進行設(shè)計? SDN即軟件定義網(wǎng)絡(luò),是一種網(wǎng)絡(luò)設(shè)計理念,只要網(wǎng)絡(luò)硬件可以集中式軟件管理,可編程化,控制轉(zhuǎn)發(fā)層面分開,則可以認(rèn)為這個網(wǎng)絡(luò)是一個SDN網(wǎng)絡(luò)。所以說,SDN并不是一個具體的技術(shù),不是一個具體的協(xié)議,而是一個思想、一個框架。它具有控制平面與轉(zhuǎn)發(fā)平面分離、控制平面集中化及網(wǎng)絡(luò)可編程這三個特征。就銀行的云管平臺項目而言,由于金融行業(yè)強調(diào)安全可控及便捷管理,因此一個好的網(wǎng)絡(luò)管理模塊對于云平臺的重要性來說不言而喻。而SDN模塊在云平臺網(wǎng)絡(luò)管理主要體現(xiàn)在:一是自動化;二是多租戶需求;三是通過SDN的方式能夠把PaaS進行隔離,從而能夠更好的進行使用,另外還有訪問方面的一些需求。SDN網(wǎng)絡(luò)架構(gòu)的改變是銀行業(yè)最難啃的一塊骨頭,而在最難啃的骨頭中我們又會涉及到異構(gòu)的管理,和新舊的管理。 SDN的設(shè)計理念是將網(wǎng)絡(luò)的控制面與數(shù)據(jù)轉(zhuǎn)發(fā)面進行分離,并實現(xiàn)可編程化控制。SDN的典型架構(gòu)共分三層,最上層為應(yīng)用層,包括各種不同的業(yè)務(wù)和應(yīng)用;中間的控制層主要負(fù)責(zé)處理數(shù)據(jù)平面資源的編排,維護網(wǎng)絡(luò)拓?fù)?、狀態(tài)信息等;最底層的基礎(chǔ)設(shè)施層負(fù)責(zé)基于流表的數(shù)據(jù)處理、轉(zhuǎn)發(fā)和狀態(tài)收集。 從傳統(tǒng)的網(wǎng)絡(luò)設(shè)備(路由器,交換機)的設(shè)計上看,它由軟件控制和硬件數(shù)據(jù)通道組成。軟件控制包括管理(CLI,SNMP)以及路由協(xié)議(OSPF,ISIS,BGP)等。數(shù)據(jù)通道包括針對每個包的查詢、交換和緩存。此時如果將網(wǎng)絡(luò)中所有的網(wǎng)絡(luò)設(shè)備視為被管理的資源,那么參考操作系統(tǒng)的原理,可以抽象出一個網(wǎng)絡(luò)操作系統(tǒng)的概念,這個網(wǎng)絡(luò)操作系統(tǒng)一方面抽象了底層網(wǎng)絡(luò)設(shè)備的具體細(xì)節(jié),同時還為上層應(yīng)用提供了統(tǒng)一的管理視圖和編程接口。這樣,基于網(wǎng)絡(luò)操作系統(tǒng)這個平臺,用戶可以開發(fā)各種應(yīng)用程序,通過軟件來定義邏輯上的網(wǎng)絡(luò)拓?fù)洌詽M足對網(wǎng)絡(luò)資源的不同需求,而無需關(guān)心底層網(wǎng)絡(luò)的物理拓?fù)浣Y(jié)構(gòu)。 SDN本質(zhì)上具有“控制和轉(zhuǎn)發(fā)分離”、“設(shè)備資源虛擬化”和“通用硬件及軟件可編程”三大特性,這帶來了一系列的好處。 1、設(shè)備硬件歸一化,硬件只關(guān)注轉(zhuǎn)發(fā)和存儲能力,與業(yè)務(wù)特性解耦,可以采用相對廉價的商用的架構(gòu)來實現(xiàn)。 2、網(wǎng)絡(luò)的智能性全部由軟件實現(xiàn),網(wǎng)絡(luò)設(shè)備的種類及功能由軟件配置而定,對網(wǎng)絡(luò)的操作控制和運行由服務(wù)器作為網(wǎng)絡(luò)操作系統(tǒng)(NOS)來完成。 3、對業(yè)務(wù)響應(yīng)相對更快,可以定制各種網(wǎng)絡(luò)參數(shù),如路由、安全、策略、QoS、流量工程等,并實時配置到網(wǎng)絡(luò)中,開通具體業(yè)務(wù)的時間將縮短。 基于以上考慮,對于銀行云管平臺項目而言,要想實現(xiàn)網(wǎng)絡(luò)自動化及多租戶的需求,SDN對于云管平臺來說是不可或缺的。因此就銀行對云平臺的SDN模塊選型來說,主要是以銀行自身情況為出發(fā)點,綜合考慮銀行自身的管理協(xié)調(diào)、技術(shù)力量、人員配備、平臺架構(gòu)及網(wǎng)絡(luò)架構(gòu)等,從而決定是否采用商業(yè)的解決方案還是開源的解決方案。兩種方案考慮如下: 1、 開源解決方案,如引入OVS降低了使用成本、提升了網(wǎng)絡(luò)靈活性。但這種原生的SDN方案存在諸多不足:和不同廠商對接上存在很多的技術(shù)間隙、缺乏對網(wǎng)絡(luò)資源的統(tǒng)一靈活編排、缺乏分級的網(wǎng)絡(luò)資源管理能力以及對網(wǎng)絡(luò)設(shè)備的管理及存在定制化差異等。對于開源方案來說大多只是簡單的SDN應(yīng)用,想要契合自身業(yè)務(wù),必不可少需要進行二次開發(fā),且還要建立在有人才支撐的前提下,否則只有引入商業(yè)方案。 2、 對于商業(yè)的解決方案來說,總結(jié)業(yè)界云管平臺SDN方案從實現(xiàn)方式上可以分為兩大類:基于軟件Overlay方案、基于硬件Overlay方案。軟件的Overlay方案主要是VMware的NSX方案;硬件Overlay方案的廠商以華為、華三及思科這三家的產(chǎn)品為主。結(jié)合云管平臺自身網(wǎng)絡(luò)設(shè)計為出發(fā)點進行考慮選擇硬件Overlay方案,并結(jié)合云管平臺方案的選型來綜合考慮這三家硬件廠商的SDN方案,確保SDN與云管平臺一致性和兼容性,并在選型的過程中考慮價格、功能和性能等因素。 十二、如何在銀行云管平臺項目上線后對運維工作進行管理安排? 就銀行業(yè)來說,一個云管平臺項目的建設(shè)過程時間并不長(小的1個月之內(nèi),大的2到3個月),建設(shè)完成之后就面臨著平臺的運維工作,大點的云管平臺還存在著運營工作,兩者功能大都類似,但又不盡相同;一個偏向于保障,一個偏向于經(jīng)營;而運維是運營的基礎(chǔ),只有做好了運維,才能更好的為運營服務(wù)。因此這里著重介紹下云管平臺上線后的運維工作。 1、運維制度的建立: 對于銀行業(yè)來說,良好的制度是保障業(yè)務(wù)穩(wěn)定運行的前提,也是業(yè)務(wù)流程標(biāo)準(zhǔn)化的硬性規(guī)定。因此對于云管平臺項目的運維工作來說,制定先行才能確保運維工作順利有序進行。在此我們制定了《云管平臺日常巡檢規(guī)范》、《云管平臺故障處置條例》、《云管平臺業(yè)務(wù)申請流程》、《云管平臺業(yè)務(wù)上線規(guī)范》、《云管平臺業(yè)務(wù)下線流程》、《云管平臺安全管理規(guī)范》、《云管平臺日常巡檢指導(dǎo)書》等一系列制度。 2、運維人員的配置: 運維人員的配置是保障運維工作順利開展的基礎(chǔ),只有打好了基礎(chǔ)才能確保工作的順利實施。因此就云管平臺來說對于運維人員的考慮,也需充分考慮銀行現(xiàn)有的運維力量;對于大多數(shù)中心銀行來說,運維人員比較有限,如果配置專門的云平臺運維人員對于銀行的經(jīng)濟和人力成本來說壓力較大,大的銀行對大型的云平臺可以考慮配置專門的運維組織架構(gòu)和人員。因此就大部分如何利用現(xiàn)有運維人員來對云管平臺進行運維是必須要考慮的問題。由于現(xiàn)有運維人員對于其它系統(tǒng)的運維工作已經(jīng)輕車熟路,業(yè)務(wù)也比較熟悉,因此可考慮在日常的運維工作中加入云管平臺監(jiān)控這一塊到日常的巡檢工作中去,人員可以復(fù)用原來的運維人員。 3、運維任務(wù)的確定: 運維體系設(shè)計:主要包括云平臺基礎(chǔ)架構(gòu)標(biāo)準(zhǔn)制定和執(zhí)行、業(yè)務(wù)遷移規(guī)劃及管理。 運維日常流程:主要包括監(jiān)控并維護云環(huán)境的穩(wěn)定運行、云環(huán)境中系統(tǒng)及應(yīng)用的日常操作、機房環(huán)境及基礎(chǔ)架構(gòu)監(jiān)控和維護;并按照《云管平臺日常巡檢指導(dǎo)書》的要求填寫每日的《云管平臺巡檢日報》。 運維故障管理:主要包括日常告警的監(jiān)控及處理及計劃的災(zāi)備演練等。 運維變更管理:主要包括業(yè)務(wù)上線及下線的處理,業(yè)務(wù)方日常的工單處理。 運維容量規(guī)劃:對于云管平臺容量進行日常監(jiān)控,一旦發(fā)現(xiàn)容量閥值超過預(yù)警,及時規(guī)劃及擴容新的資源,確保云平臺的穩(wěn)定可靠。 4、云管平臺的培訓(xùn): 培訓(xùn)工作是在運維介入之前就必須要開展起來,讓相應(yīng)的運維人員了解整個云管平臺的相關(guān)知識。對此就云管平臺的產(chǎn)品、業(yè)務(wù)流程、架構(gòu)流程、告警查看、問題反饋處理等方面進行專門的培訓(xùn),讓運維人員充分了解平臺的細(xì)節(jié)內(nèi)容。 以上對云管平臺的運維工作做了簡要的介紹,但其中的也存在著云管平臺告警監(jiān)控的難點問題:由于云管平臺有一套自身的監(jiān)控軟件,而傳統(tǒng)的系統(tǒng)也有一套監(jiān)控軟件,這對運維人員來說,需要在這2套軟件之間來回進行切換,而傳統(tǒng)的監(jiān)控軟件對于銀行來說確是十分重要,這就會導(dǎo)致云管平臺監(jiān)控的間隙問題。因此可以通過接口對接的方式就云管平臺的監(jiān)控告警推送至傳統(tǒng)監(jiān)控軟件上,用一套系統(tǒng)分別對傳統(tǒng)及云管平臺進行監(jiān)控,覆蓋面拓深,消除監(jiān)控間隙。 |
|