乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      東方國信:7個步驟讓大數(shù)據(jù)開口說話

       qinjy2008 2016-05-11

        【IT168 評論】“讓數(shù)據(jù)開口說話”,并不是一件容易的事。如同人類要想開口說話,信息的輸入、儲存、加工、處理,最終把思想以一種合適的方式表達出來,需要經(jīng)過一個復(fù)雜的化學(xué)反應(yīng)過程。對計算機系統(tǒng)而言,要想讓數(shù)據(jù)開口說話,也要經(jīng)過一個復(fù)雜的電子信息處理過程。在數(shù)據(jù)量呈爆炸式增長,數(shù)據(jù)類型呈多樣化表現(xiàn),數(shù)據(jù)價值日益受到重視的大數(shù)據(jù)時代,這個過程會變得更加復(fù)雜,應(yīng)用也會更加廣泛。

        東方國信,一家堅持了18年自主研發(fā)之路的IT企業(yè),正在試圖通過一個完整的解決方案讓大數(shù)據(jù)開口說話。

        2014年8月7日,東方國信在北京召開了一次產(chǎn)品發(fā)布會,公司董事長兼總經(jīng)理管連平宣布推出針對各行業(yè)大數(shù)據(jù)的“端到端的完整解決方案”,囊括了多達20多種產(chǎn)品。我們知道,看似或零碎、或雜亂的數(shù)據(jù),要想變成對企業(yè)業(yè)務(wù)有價值的決策參考信息或營銷建議,需要經(jīng)歷數(shù)據(jù)采集、存儲、處理、加工、管理、監(jiān)控、分析、展現(xiàn)等多道工序。東方國信的這20多種產(chǎn)品幾乎在每道工序上都有所涉及。

      東方國信:7個步驟讓大數(shù)據(jù)開口說話
      ▲東方國信大數(shù)據(jù)產(chǎn)品線

        如此布局,東方國信也要面對來自O(shè)racle、IBM、SAP、Cloudera、EMC、SAS等多家國際巨頭的競爭,因為這些廠商在上述工序已經(jīng)有一些非常有代表性的全球領(lǐng)先產(chǎn)品?!爸苯訉藝H巨頭進行自主研發(fā)”,東方國信的信心來自哪里?

        “來自三個方面,一是針對大數(shù)據(jù)這種新技術(shù),大家都在起步階段,國內(nèi)外的差距比較小,;二是中國的客戶更看重高投資回報率,注重性價比;三是國際廠商的產(chǎn)品對中國市場的適應(yīng)性不強,比如一些功能用不上,不適合中國本土用戶的使用習(xí)慣,而國外廠商又很難改變產(chǎn)品策略。”東方國信規(guī)劃咨詢總監(jiān)李云峰博士表示,“所以我們有底氣進行自主研發(fā)?!?/p>

        下面,我們來看看東方國信的產(chǎn)品組合是如何一步步讓那些枯燥的大數(shù)據(jù)開始說話的。根據(jù)李云峰博士的專題介紹,筆者將其歸納為7個步驟:

        第一步:數(shù)據(jù)采集

        把數(shù)據(jù)采集上來,這是首要基礎(chǔ),無論是網(wǎng)站的用戶訪問日志,運營商網(wǎng)絡(luò)設(shè)備端口信息,銀行的交易記錄,高爐里的溫度數(shù)據(jù)等等,只有采集起來,才有進行下一步的可能。東方國信提供的Dprobe大數(shù)據(jù)采集設(shè)備從網(wǎng)絡(luò)接口采集數(shù)據(jù),可以為運營商的智能管道應(yīng)用、政府的網(wǎng)絡(luò)安全監(jiān)管等領(lǐng)域?qū)崿F(xiàn)海量數(shù)據(jù)的實時采集,通過硬件加速和軟件相結(jié)合的方式,可以實現(xiàn)單臺設(shè)備每秒10G的采集速度,遠遠高于傳統(tǒng)x86方案的每秒3G,而且功耗只有1/8,體積只有1/6。

        第二步:數(shù)據(jù)存儲

        在硬件層面,根據(jù)不同應(yīng)用環(huán)境對于計算能力和存儲能力的不同要求,東方國信推出了三種大數(shù)據(jù)專用設(shè)備:計算存儲均衡型、計算密集型和存儲密集型。比如對于銀行環(huán)境中身份證掃描圖像這種非結(jié)構(gòu)化數(shù)據(jù)的存儲,由于容量大,業(yè)務(wù)流轉(zhuǎn)過程中也需要在線存取,就需要一種高性比、可擴展的方案來支撐。

        第三步:數(shù)據(jù)處理

        今天對于大數(shù)據(jù)的存儲和處理,一般會想到使用Hadoop技術(shù)。Hadoop也已發(fā)展成為繼Linux之后最成功的開源軟件之一,成本低廉,擴展靈活。但問題在于,這種原生于互聯(lián)網(wǎng)生態(tài)環(huán)境中的技術(shù),要想用到傳統(tǒng)企業(yè)計算環(huán)境,卻并非易事。開源的Hadoop之所以不能直接用于企業(yè)信息系統(tǒng),就在于其需求、服務(wù)、研發(fā)和運維體系都不同于互聯(lián)網(wǎng)應(yīng)用,比如訪問網(wǎng)頁時允許一定程度上的出錯和數(shù)據(jù)丟失,但在銀行轉(zhuǎn)帳時如果出錯,其后果就可能是災(zāi)難性的了。據(jù)中科院計算所副研究員查禮博士介紹,要想在企業(yè)環(huán)境中使用Hadoop,必須滿足幾個條件:兼容關(guān)系模型和SQL語言,完善關(guān)系模型產(chǎn)品與Hadoop“混搭”的架構(gòu),增強系統(tǒng)運維和數(shù)據(jù)處理工具,軟硬一體優(yōu)化配置硬件效能,集成開源社區(qū)Hadoop最新版本等。

        對此,東方國信專門開發(fā)了面向企業(yè)環(huán)境的Hadoop發(fā)行版,在底層的數(shù)據(jù)壓縮技術(shù)、行列混合數(shù)據(jù)存儲、圖形化運維管理工具等方面做了增強,使得這種源于互聯(lián)網(wǎng)的大數(shù)據(jù)技術(shù)也能適用于傳統(tǒng)企業(yè)環(huán)境。

        據(jù)李云峰介紹,東方國信還開發(fā)了MPP分布式數(shù)據(jù)庫,融合了Hadoop平臺和MPP架構(gòu)的優(yōu)勢,滿足從TB級到PB級的海量數(shù)據(jù)存儲和分析。其價值在于,這些數(shù)據(jù)可以分布在數(shù)百臺普通服務(wù)器上,并能夠被大量并發(fā)用戶高速訪問,從而滿足數(shù)據(jù)密集型行業(yè)日益增大的數(shù)據(jù)分析、挖掘、備份和即席查詢的需求。

        第四步:數(shù)據(jù)加工

        數(shù)據(jù)加工的關(guān)鍵在于找到數(shù)據(jù)之間的關(guān)聯(lián)性,這些零散的信息關(guān)聯(lián)在一起才能產(chǎn)生價值。比如在運營商環(huán)境中的“用戶畫像”,就是把某個用戶的上網(wǎng)行為數(shù)據(jù)、關(guān)系鏈、交易信息、搜索數(shù)據(jù)等關(guān)聯(lián)在一起,才得以實現(xiàn),進而可以為這個用戶提供更精準的個性能服務(wù)。李云峰談到,東方國信解決方案的核心點在于通過云化ETL(提取-轉(zhuǎn)換-加載)平臺實現(xiàn)了數(shù)據(jù)的統(tǒng)一規(guī)范,并可實現(xiàn)橫向擴展,滿足對PB級數(shù)據(jù)的加工處理。

        顯然,統(tǒng)一數(shù)據(jù)管理對于擁有多家子公司、多個系統(tǒng)的企業(yè)來說更為關(guān)鍵,否則即便是一個最簡單的KPI指標,從不同的系統(tǒng)調(diào)出來都會大相徑庭,導(dǎo)致企業(yè)領(lǐng)導(dǎo)無法決策。通過ETL工具來整合這些來自不同“孤島”系統(tǒng)的數(shù)據(jù),經(jīng)過轉(zhuǎn)換、清洗等步驟,讓數(shù)據(jù)具備了開口說話的能力。

        除了ETL工具,元數(shù)據(jù)管理工具則可以弄清楚數(shù)據(jù)的來源、含義、類型等,進一步提高數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量平臺可以實現(xiàn)全生命周期的質(zhì)量監(jiān)控和審核,保障數(shù)據(jù)的完整性、準確性、一致性和及時性。正是通過數(shù)據(jù)的加工,進而讓數(shù)據(jù)建模、數(shù)據(jù)分析挖掘成為可能,大數(shù)據(jù)也才能正常說話,而不是胡言亂語。

        第五步:數(shù)據(jù)分析

        數(shù)據(jù)分析的目的是在海量的數(shù)據(jù)中挖掘出有價值的信息。李云峰談到,東方國信的探索式分析工具,可以將幾十億條明細數(shù)據(jù)用思維導(dǎo)圖的方式進行分析,以更直觀的豐富視圖來展示結(jié)果,從而深入洞察數(shù)據(jù)之間的關(guān)聯(lián)性及潛在影響。在這一方面,東方國信的首眼點是,速度要快,而且分析的結(jié)果要方便共享,以展現(xiàn)給不同需要的人。至此,大數(shù)據(jù)平臺已經(jīng)準備好了要說的內(nèi)容了。

        第六步:數(shù)據(jù)展現(xiàn)

        數(shù)據(jù)分析出來的結(jié)果往往會用于決策參考或輔助營銷。東方國信通過自助報表的方式來構(gòu)建展現(xiàn)過程,允許業(yè)務(wù)端的用戶在終端對數(shù)據(jù)進行存取和個性化展現(xiàn),這可以理解為大數(shù)據(jù)說話時非常靈活的表達方式。其中三個最典型的應(yīng)用是統(tǒng)計報表、即席查詢、OLAP分析,比如按時間、地域來關(guān)聯(lián)分析以找到有用的信息。

        當(dāng)然,針對不同的人,大數(shù)據(jù)要說的話也是不一樣的。以東方國信的一大重要客戶中國聯(lián)通為例,針對內(nèi)部的公司高層、分析人員、一線客戶經(jīng)理,以及外部的行業(yè)客戶、咨詢機構(gòu),大數(shù)據(jù)平臺所呈現(xiàn)出來的內(nèi)容也是豐富多彩,各不相同。正是基于東方國信的個性化定制工具以及自助報表,使得大數(shù)據(jù)在中國聯(lián)通獲得了極為廣泛的實際應(yīng)用價值。

        第七步:移動應(yīng)用

        在移動互聯(lián)網(wǎng)時代,如果能把數(shù)據(jù)分析的結(jié)果推送到手機或iPad上面,顯然會進一步提高業(yè)務(wù)效率。東方國信已經(jīng)將自助分析能力擴展到了移動設(shè)備,方便用戶快速的看到自己喜歡的各種分析圖表。

        比如,中國聯(lián)通位于各地的一些一線客戶經(jīng)理,可能之前的職業(yè)是幼兒園的老師、護士,甚至不會使用EXCEL表,而“掌上營銷”這樣一款應(yīng)用,無疑是為她們配上了一個“貼身的分析師”,隨時隨地查看自己客戶的動態(tài),根據(jù)分析結(jié)果判斷哪些客戶可能會流失,哪些客戶需要生日問候,從而更快速地采取行動。

        可見,“讓大數(shù)據(jù)開口說話”,看似簡單,卻是個復(fù)雜的系統(tǒng)工程。不同于其他廠商針對于單一產(chǎn)品的發(fā)力,東方國信此次推出的是一站式的解決方案,涉及產(chǎn)品眾多。其實在筆者看來,今天的大數(shù)據(jù)領(lǐng)域并不缺乏技術(shù)層面的創(chuàng)新,市場上已經(jīng)有很多不錯的產(chǎn)品或技術(shù)出現(xiàn),但能用好的并不多,真正缺乏的是應(yīng)用層面的創(chuàng)新和落地。東方國信的大數(shù)據(jù)產(chǎn)品線聚合了很多先進的技術(shù),如Hadoop、ARM服務(wù)器、流式計算、數(shù)據(jù)建模、移動計算等等,但其生命力還在于跟電信、金融等各行業(yè)業(yè)務(wù)實踐的深度結(jié)合。畢竟,一個人要想說話,光有嘴巴是不行的,還需要耳朵、腦袋……以及源源不斷的信息輸入。大數(shù)據(jù)系統(tǒng)要想發(fā)揮出自身的價值,實時、準確地說得有見地的話,亦然!

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多