乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      談談大數(shù)據環(huán)境下的數(shù)據集成新模式

       數(shù)據治理精英館 2021-12-24

      一、數(shù)據集成(Data Integration DI)概述

      信息技術發(fā)展迅速。但這并不總是導致現(xiàn)有技術滅絕。想想信息傳播的渠道,比如廣播、電視和互聯(lián)網。例如,許多人認為電視將取代收音機,因特網將使電視和收音機都變得無用或多余?那還沒有發(fā)生。無線電仍然使用和傳播,但方式與1970年不同。電視一開始可能只有三個網絡,但現(xiàn)在它的覆蓋面更廣了?;ヂ?lián)網為分享信息提供了許多新的選擇,但仍有許多人通過廣播或電視收聽或收看。想想流媒體電影、衛(wèi)星廣播和機頂盒。舊技術不但沒有消亡,反而常常能夠共存。

      數(shù)據集成就是這樣。數(shù)據集成現(xiàn)在需要隱式地包含在日常業(yè)務操作中,而不是主要在批處理的基礎上使用內部數(shù)據。它需要同時處理本地和外部源,同時在不同的延遲下工作,從實時到流。接下來讓我們看看數(shù)據集成是如何發(fā)展到現(xiàn)在的,它是如何繼續(xù)發(fā)展的,以及組織必須做些什么來保持他們的DI方法的相關性。

      二、數(shù)據集成要適應環(huán)境變化

      當組織意識到他們需要多個系統(tǒng)或數(shù)據源來管理業(yè)務時,數(shù)據集成就開始了。通過數(shù)據集成,組織可以將多個數(shù)據源組合在一起。數(shù)據倉庫經常使用數(shù)據集成技術來整合操作系統(tǒng)數(shù)據并支持報告或分析需求。

      但事情越來越復雜。當大量的應用程序、系統(tǒng)和數(shù)據倉庫形成了一個難以維護的數(shù)據大雜燴時,企業(yè)架構師開始創(chuàng)建更智能的框架來集成數(shù)據。他們創(chuàng)建了規(guī)范模型、面向批處理的ETL/ELT(extract trans-form load,extract load-transform)、面向服務的體系結構、企業(yè)服務總線、消息隊列、實時web服務、使用本體的語義集成、主數(shù)據管理等等。

      經過這么長時間,有了這些成熟的技術,為什么我們還需要新的數(shù)據集成模式?

      數(shù)據集的變化可以歸結為以下三種趨勢:

      ·越來越多的組織為獲得競爭優(yōu)勢除了使用本地數(shù)據還使用外部數(shù)據,數(shù)據源包括社交媒體、非結構化文本和來自智能終端和其他設備的傳感器數(shù)據。

      ·數(shù)據量以前未有的速度增長。

      ·Hadoop使用的增加。

      這些趨勢給現(xiàn)有的基礎設施帶來了巨大的壓力,迫使它們去做一些原本不打算做的事情。在面對大數(shù)據時,由于技術不靈活,許多組織發(fā)現(xiàn)幾乎不可能充分利用所有的數(shù)據。除此之外,他們還需要關注邏輯數(shù)據倉庫的出現(xiàn)、集成模式的必要共存以及支持這些需求所需的新功能,如Hadoop、NoSQL、內存計算和數(shù)據虛擬化。

      三、大數(shù)據增加了數(shù)據集成的復雜性

      在所有影響數(shù)據整合的趨勢中,最大的改變游戲規(guī)則的是大數(shù)據。大數(shù)據正在迅速升級數(shù)據集成挑戰(zhàn)。為什么?

      ·隨著大數(shù)據的出現(xiàn),各種數(shù)據結構之間的差異變得更加顯著。

      ·整合外部數(shù)據源意味著組織對數(shù)據源的數(shù)據標準幾乎沒有控制權。

      ·體積和速度呈指數(shù)增長,將系統(tǒng)和過程推向極限。

      我們必須重新思考組織如何管理數(shù)據。我們必須重新設計我們的信息管理戰(zhàn)略,使之與之相匹配。讓我們看看今天的情況。

      1、物聯(lián)網

      根據Gartner的數(shù)據,到2020年,通過物聯(lián)網連接的設備將超過200億臺。這些設備已經產生了大量連續(xù)流動的數(shù)據。想想遠程患者監(jiān)控、預測性資產維護、智能能源網、基于位置的促銷和智能城市(建筑和交通管理)。這些只是物聯(lián)網將如何改變我們生活的世界的一些場景。

      現(xiàn)在最緊迫的挑戰(zhàn)是找到經濟上可行的方法來存儲所有這些流數(shù)據。云和Hadoop平臺是一些更有希望的答案。另一個挑戰(zhàn)是通過分析實時處理這些數(shù)據的能力,從數(shù)據中獲取近乎即時的洞察力。在這里,像事件流處理這樣的技術可以在數(shù)據到達數(shù)據存儲之前分析數(shù)據,在創(chuàng)建數(shù)據時識別關注數(shù)據的模式。

      2、新一代客戶智能

      客戶關懷一直是企業(yè)關注的焦點,原因顯而易見。通過客戶關系管理(CRM)應用程序,企業(yè)可以跨渠道改善客戶體驗,并提出客戶可能購買的產品和服務。CRM通過主數(shù)據管理構建客戶數(shù)據的單一視圖。這種單一的視圖可以提高營銷活動的效率,推動更好的保留率,創(chuàng)造新的交叉銷售和追加銷售機會,并對客戶終身價值等方面有更多的了解。

      大數(shù)據帶來的變化是,企業(yè)現(xiàn)在有機會通過整合全新的數(shù)據源來構建更完整、更準確的客戶視圖。包括 社交媒體或網絡論壇,或者組織已經擁有但不能很好處理的現(xiàn)有數(shù)據,比如電子郵件和電話錄音。

      有了新的數(shù)據源,組織可以:

      ·根據客戶反饋,對客戶保留或產品開發(fā)進行情緒分析。

      ·進行實時營銷,使他們能夠快速確定最重要的客戶。

      ·在交互點提供次優(yōu)報價,或根據用戶位置向移動設備發(fā)送定制建議。

      由于涉及的數(shù)據量、存儲所有這些額外數(shù)據所需的成本以及數(shù)據的非結構化性質,傳統(tǒng)的企業(yè)數(shù)據倉庫不適合處理這種新的復雜性。為了使用這些新的數(shù)據源實現(xiàn)高級客戶智能,我們顯然需要新的數(shù)據集成技術。

      3、防止欺詐和報告風險的新監(jiān)管要求

      金融機構正面臨前所未有的壓力,要求它們加強防范欺詐和風險管理框架。

      監(jiān)管機構要求銀行采取的措施帶來了許多數(shù)據集成挑戰(zhàn):

      ·風險報告現(xiàn)在通常以銀行沒有真正準備好的方式進行。風險數(shù)據匯總必須在企業(yè)級進行,整合所有部門、業(yè)務線和國家/地區(qū)的風險數(shù)據。

      ·銀行必須能夠在幾分鐘內而不是幾周內重新計算整個風險投資組合。監(jiān)管報告以及第三方風險評估必須基于實時數(shù)據實時生成。這需要超出當前數(shù)據基礎架構范圍的靈活性。

      ·最后,銀行需要根據基礎數(shù)據的質量來衡量報告的可信度。這意味著它們可以建立聚合過程的譜系,并根據預定義的標準度量數(shù)據質量。

      在欺詐檢測和預防方面,金融機構必須能夠基于交易數(shù)據實時識別欺詐行為模式。他們需要能夠發(fā)現(xiàn)欺詐網絡。當然,他們需要立即停止欺詐交易。

      實時處理這些高度不穩(wěn)定的數(shù)據以便他們能夠立即采取行動需要新的數(shù)據集成技術。

      4、數(shù)據貨幣化

      在物聯(lián)網的推動下,數(shù)據貨幣化現(xiàn)在是一種利用有價值的數(shù)據資產創(chuàng)造新收入渠道的具體方式。電信和媒體公司、零售商、金融機構、通信服務提供商和其他行業(yè)也是如此。這些公司面臨的主要問題是,如何在利用這些數(shù)據賺錢的同時遵守隱私問題和法規(guī)。

      通常的挑戰(zhàn)仍然存在——在不同的組織之間共享數(shù)據以及整合內部和外部數(shù)據。但應用于數(shù)據貨幣化計劃的數(shù)據集成帶來了一系列全新的問題:

      ·如何在控制數(shù)據的同時共享數(shù)據。

      ·如何確保安全和隱私要求得到明確定義和遵守。

      ·如何管理適當?shù)脑L問權限粒度級別。

      ·如何確保治理框架和工具能夠有效地定義哪些是可接受的,哪些是不可接受的,如何控制數(shù)據的共享方式,以及如何監(jiān)控數(shù)據的使用。

      ·如何加快數(shù)據集成以實現(xiàn)近實時決策。

      這些挑戰(zhàn)要求我們重新思考現(xiàn)有的數(shù)據集成模式和工具集。

      5、成本優(yōu)化和流程效率壓力

      IT和業(yè)務部門都面臨著降低運營成本的壓力。大數(shù)據給這一領域帶來了新的潛力。下面舉幾個例子。

      ·價格和庫存優(yōu)化。數(shù)據在通過價格和銷售效率實現(xiàn)增長方面起著關鍵作用。整合大數(shù)據將帶來更深入的洞察。

      ·交付優(yōu)化。對于物流或航運業(yè)的大公司來說,路線優(yōu)化并不是什么新鮮事,但GPS數(shù)據以及傳感器數(shù)據提供了優(yōu)化各種事物的新方法??紤]車輛保養(yǎng)、里程成本、自我完善的路線優(yōu)化、客戶服務等。車隊遠程通信和高級分析可能會將路線優(yōu)化提升到一個新的水平。但是,能夠有效地集成和準備生成的大量數(shù)據是成功的基本條件。

      ·預測性資產維護。這一能力為石油和天然氣、制造業(yè)、物流和電信等行業(yè)削減成本帶來了巨大機遇。但這給數(shù)據集成帶來了嚴重障礙。這是因為它需要主動收集和分析來自傳感器的大量數(shù)據,將這些數(shù)據與歷史數(shù)據聚合在一起,并能夠識別模式,從而發(fā)出預警并采取預防措施。

      ·IT基礎設施。在降低IT成本方面,現(xiàn)在能夠以低成本存儲數(shù)據,并通過授權非技術用戶來減少技術資源的工作量。與傳統(tǒng)的數(shù)據倉庫設備服務器相比,Hadoop等大數(shù)據生態(tài)系統(tǒng)提供了一種經濟高效的數(shù)據存儲方式。當數(shù)據量越大時優(yōu)勢越明顯。Hadoop還可以部署在廉價的硬件上進行數(shù)據處理和存儲,并且該軟件比傳統(tǒng)的數(shù)據庫軟件便宜。Hadoop還為企業(yè)用戶或數(shù)據科學家打開了一扇大門,讓他們能夠在不受IT干預的情況下使用大數(shù)據并從中獲取見解。

      許多組織正在采用自助數(shù)據準備,因此技術資源不必處理臨時報告和準備請求。

      TDWI發(fā)現(xiàn),無論組織在數(shù)據驅動的道路上走了多遠,他們仍然列舉了以下五個障礙,以改進數(shù)據和分析的使用,從而推動決策、管理日常運營和制定戰(zhàn)略:

      ·缺乏執(zhí)行支持公司戰(zhàn)略。

      ·難以訪問和整合所有相關數(shù)據。

      ·缺乏構建BI/分析以支持決策或行動的技能。

      ·數(shù)據質量不足。

      ·數(shù)據治理和安全問題。

      四、數(shù)據管理戰(zhàn)略面臨的新挑戰(zhàn)

      從數(shù)據集成的角度來看,大數(shù)據的破壞性影響是顯而易見的。在這一點上,IT部門試圖弄清楚如何實現(xiàn)大數(shù)據的承諾,以及它對他們的數(shù)據管理戰(zhàn)略意味著什么。三個領域對數(shù)據戰(zhàn)略尤其重要:數(shù)據訪問和存儲、元數(shù)據管理和大數(shù)據治理。

      1、數(shù)據存取和存儲以及實時存取和傳送

      大數(shù)據將涉及大量數(shù)據,這意味著企業(yè)必須找到更省錢的數(shù)據存儲方式,以便補充現(xiàn)有的數(shù)據倉庫基礎設施。傳統(tǒng)的關系數(shù)據庫管理系統(tǒng)(RDBMS)不一定是經濟上可行的選擇。

      企業(yè)在處理各種各樣的數(shù)據源和格式時,必須設法避免與傳統(tǒng)數(shù)據集成技術相關的成本和復雜性。例如,它們必須適應諸如操作應用程序、網絡和社交媒體、傳感器和智能儀表等源,以及包括基于文件、語音記錄、關系數(shù)據庫和事件流數(shù)據在內的格式。

      Hadoop處理讀模式而不是寫模式的能力提供了所需的敏捷性,可以快速地將新的數(shù)據源引入系統(tǒng),而不必將不適當?shù)母袷饺M預定義的數(shù)據模型中。Hadoop可以用作:

      ·新一代數(shù)據倉庫,以擴充或補充傳統(tǒng)的RDBMS。

      ·為新數(shù)據類型尤其是RDBMS無法處理的非結構化數(shù)據和新數(shù)據源如web、社交網絡和傳感器數(shù)據提供新的數(shù)據存儲。

      ·數(shù)據湖,將組織的所有可用數(shù)據暫存在最低處理狀態(tài)。

      傳統(tǒng)上,數(shù)據訪問取決于預定義的數(shù)據模型、預定義的數(shù)據集和預定義的分析模型。任何變更都需要IT部門的參與,這通常意味著在設計、實現(xiàn)和測試方面需要更長的周期。但為了跟上競爭對手的步伐,企業(yè)需要實時訪問數(shù)據。只有這樣,他們才能在需要時靈活地從數(shù)據中提取有價值的見解。

      像自助數(shù)據準備這樣的技術使這成為可能。組織需要能夠在數(shù)據產生或可用后立即使用數(shù)據,以便員工能夠實時做出決策,并在事件發(fā)生時立即采取行動。

      要做到這一點,他們必須能夠動態(tài)地分析數(shù)據流,甚至在數(shù)據到達數(shù)據存儲之前。事件流處理通過每秒流式傳輸數(shù)百萬條記錄并提供盡可能最新的信息來滿足這一需求。

      2、元數(shù)據管理

      傳統(tǒng)的元數(shù)據管理通過開發(fā)邏輯數(shù)據模型來描述數(shù)據庫之間的關系。這解決了與數(shù)據豎井相關的固有不一致性,并支持出于報告或分析目的的數(shù)據共享。

      但是隨著數(shù)據源數(shù)量的增加,包括不在消費組織控制下的數(shù)據源,主動管理元數(shù)據變得越來越困難。此外,在Hadoop中使用基于讀取原理的模式時,加載的數(shù)據的格式在入口可能是未知的。最后,必須定義元數(shù)據,以便共享和理解數(shù)據。

      有了大數(shù)據,通過映射試圖弄清楚每一點數(shù)據是不現(xiàn)實的。

      相反,組織需要關注:

      ·數(shù)據源映射、意義和相關性,而不是數(shù)據模型。

      ·應用于選定數(shù)量的業(yè)務關鍵型數(shù)據元素的語義元數(shù)據。

      ·定義業(yè)務術語和所有者,并將其與技術元數(shù)據相關聯(lián)。

      反過來,使用這些數(shù)據的人將負責提供有用的業(yè)務定義,說明這些數(shù)據是什么和做什么。

      3、大數(shù)據治理

      在大數(shù)據環(huán)境下,數(shù)據集成的主要挑戰(zhàn)之一是建立和維持正確的治理水平。也不全是技術問題。數(shù)據質量、數(shù)據隱私和安全、相關性和意義等關鍵問題必須在企業(yè)級加以考慮。

      讓我們再深入一點。鏈接到新的數(shù)據源,特別是外部數(shù)據源和非結構化數(shù)據,將使數(shù)據無法用于典型的數(shù)據治理計劃。換言之,標準和數(shù)據質量將不再受到源頭控制。

      盡管如此,試圖強制實施大數(shù)據的傳統(tǒng)質量級別可能會抹殺與快速數(shù)據集成和實時處理數(shù)據流相關的大數(shù)據計劃的預期好處。在數(shù)據質量要求和大數(shù)據速度的好處之間,顯然可以找到一個平衡點。

      將大量數(shù)據帶入數(shù)據湖將引發(fā)圍繞隱私條例和安全的問題。我們有權存儲這些數(shù)據嗎?要多久?例如,《一般數(shù)據保護條例》規(guī)定了歐盟居民數(shù)據的隱私和保護規(guī)則。組織不僅需要考慮如何處理這些數(shù)據,還需要考慮處理這些數(shù)據的方法。誰應該訪問數(shù)據?我們怎樣才能使用它呢?數(shù)據治理機構必須通過定義規(guī)則并監(jiān)控其在整個組織中的應用來解決這些問題。元數(shù)據管理和數(shù)據血緣是幫助組織遵守隱私和安全要求的重要技術。

      業(yè)務詞匯表是另一種方法,可以用來存儲諸如“利潤”或“客戶”之類的業(yè)務術語,并將它們與字段或報表之類的技術元數(shù)據相關聯(lián)。通過這種方式,用戶可以看到更改表中的字段將如何影響下游的其他數(shù)據源、目標、分析模型或報表。

      即使不需要從存儲的角度停用數(shù)據,我們仍然需要管理數(shù)據生命周期,以保持對相關數(shù)據的關注。這將避免外來噪音,并防止數(shù)據湖成為數(shù)據沼澤。

      案例:

      能源領導者將數(shù)據轉化為客戶智能

      Enerjisa為900萬客戶提供服務,它將客戶數(shù)據保存在不同的系統(tǒng)上,并以不同的格式進行數(shù)據清理和分析。為了使各個業(yè)務領域能夠更有效地運作,Enerjisa需要創(chuàng)建一個單一的客戶數(shù)據源,所有部門都可以方便地訪問該數(shù)據源,以便進行高級分析。

      使用SAS數(shù)據管理和SAS數(shù)據質量,Enerjisa:

      ·提高了成功聯(lián)系客戶的比率。

      ·總記錄減少25%。

      ·將記錄的完整性提高了30%。

      ·為客戶智能和分析建立了基礎。

      五、數(shù)據集成模式的新范例

      在選擇將數(shù)據與消費應用程序和進程分離的方法時,沒有什么靈丹妙藥。每個組織都必須采用最適合它的集成規(guī)范和技術。下面是幾種選擇:

      ·數(shù)據虛擬化和邏輯數(shù)據倉庫可以提高靈活性和快速部署,是對傳統(tǒng)集成體系結構的增強,等等。

      ·數(shù)據可以通過不同的功能如Hadoop、NoSQL、內存計算等交付。

      ·可實時處理大容量數(shù)據流。

      ·數(shù)據服務可以通過云交付—例如,集成平臺即服務。

      1、Hadoop以及Hadoop加強

      盡管Hadoop是支持大數(shù)據的現(xiàn)代基礎設施的關鍵組件之一,但在數(shù)據管理方面,Hadoop本身顯然存在不足。

      Hadoop在廉價的數(shù)據存儲和分布式數(shù)據處理方面帶來了很多價值。它還具有容錯性和可擴展性。但是,如果沒有專門的技能,也不需要在MapReduce、Pig或HiveQL中進行大量的定制開發(fā),那么它還不夠成熟,無法有效地操作數(shù)據。

      企業(yè)最好能夠擁有一個能夠抽象復雜性的現(xiàn)代數(shù)據管理平臺。這種平臺還可以跨Hadoop和傳統(tǒng)數(shù)據倉庫系統(tǒng)重用現(xiàn)有的技能和數(shù)據集成資產,如數(shù)據質量驗證和數(shù)據轉換流。

      為了確保Hadoop不會成為與更廣泛的企業(yè)數(shù)據管理基礎設施隔離的另一個數(shù)據豎井,建立元數(shù)據血緣關系非常重要。組織還需要確保整個企業(yè)數(shù)據環(huán)境包括Hadoop中數(shù)據安全規(guī)則的一致性。數(shù)據管理平臺應在Hadoop和傳統(tǒng)RDBMS之間無縫工作,并應提供:

      ·訪問Hadoop分布式文件系統(tǒng),以便從Hadoop加載/加載到Hadoop。

      ·嵌入式數(shù)據治理,包括業(yè)務術語表、元數(shù)據管理和細粒度安全管理。

      ·嵌入式數(shù)據質量,包括分析、監(jiān)控和數(shù)據質量轉換,如解析、標準化、匹配等。

      ·分析數(shù)據準備,包括聚合、透視、轉置等。

      2、基于數(shù)據虛擬化與邏輯數(shù)據倉庫的模式

      我們已經知道傳統(tǒng)數(shù)據倉庫的局限性很多年了。首先,它需要花費大量的時間和資金來建造和維護。在大數(shù)據時代,復制數(shù)據和構建每個數(shù)據集市來回答預定義的查詢已不再實用。將數(shù)據倉庫視為報告和分析的唯一、單一的“真相版本”的概念已被證明不足以處理當今種類繁多、數(shù)量龐大的數(shù)據。而業(yè)務用戶對傳統(tǒng)的數(shù)據倉庫不滿意的原因是它通常提供錯誤的數(shù)據粒度和及時性級別,并且它們不夠靈活,無法適應不斷變化的業(yè)務需求。

      隨著大數(shù)據的出現(xiàn),新技術開始發(fā)揮作用,比如Hadoop集群和NoSQL數(shù)據庫?,F(xiàn)在很明顯,這些新的數(shù)據存儲方式不會取代傳統(tǒng)的RDBMS。相反,它們將擴展或補充RDBMS,以實現(xiàn)廉價的數(shù)據存儲和并行處理。

      為了回應Hadoop可能成為另一個數(shù)據倉庫的想法,幾年前Gartner提出了邏輯數(shù)據倉庫(LDW)的概念,這是實現(xiàn)數(shù)據虛擬化的一種方法。其想法是提供一個企業(yè)數(shù)據層,該層提供跨組織豎井的多結構和非結構數(shù)據資產的統(tǒng)一視圖。

      這種轉變從中央存儲庫和數(shù)據模型的概念轉向了數(shù)據服務、數(shù)據處理和訪問引擎的概念。LDW提供了來自傳統(tǒng)和新興數(shù)據源的虛擬數(shù)據層。

      新的數(shù)據集成模式可以通過創(chuàng)建虛擬數(shù)據層而無需物理移動數(shù)據,從而簡化數(shù)據訪問、管理、安全性和性能。這將業(yè)務用戶從復雜的Hadoop環(huán)境中解放出來。他們可以在Hadoop中查看數(shù)據,并將其與SapHana、Ibmdb2、Oracle或Teradata等其他數(shù)據庫系統(tǒng)進行虛擬混合。通過改進的安全性和治理特性確保正確的用戶可以訪問正確的數(shù)據。

      3、基于流分析和實時數(shù)據分析的模式

      許多大數(shù)據場景是基于能夠實時分析來自交易系統(tǒng)、傳感器、網絡導航日志和其他來源的大量流數(shù)據。在這些情況下,傳統(tǒng)的收集、存儲和分析數(shù)據的方法不再有效?,F(xiàn)在,我們需要能夠實時監(jiān)控高容量數(shù)據流的匯合,當它們發(fā)生時,識別事件的模式和序列,并生成洞察力,以便我們能夠立即采取行動。

      新的數(shù)據集成模式中事件流處理不再對存儲的數(shù)據運行查詢,而是存儲查詢并通過查詢流傳輸大量數(shù)據,實時過濾、聚合和檢測模式。這個過程發(fā)生在數(shù)據被存儲之前,減少了被分析信息的延遲。

      事件流處理還可以區(qū)分與業(yè)務相關的信息和無關緊要的信息—存儲重要信息,同時丟棄其余信息。反過來,組織可以大大降低存儲和處理成本,減輕傳統(tǒng)數(shù)據集成框架的負擔。最后,數(shù)據質量進程如標準化可以在流中應用,而數(shù)據處于運動狀態(tài)。

      4、基于內存計算和數(shù)據庫計算模式

      內存和數(shù)據庫計算加快了分析的價值實現(xiàn)。但它們也代表了一種減少數(shù)據移動和簡化數(shù)據集成需求的方法。

      通過將邏輯移到數(shù)據庫,或者將數(shù)據加載到內存中以便在內存中進行實時分析,在分析數(shù)據之前,不需要將各種數(shù)據源塞進規(guī)范的數(shù)據模型中。這種模式在解決方案中需要包括可視化分析和可視化統(tǒng)計、用于Hadoop的內存統(tǒng)計、高性能分析、評分加速器和數(shù)據庫技術以及用于Hadoop的數(shù)據加載器。

      越來越多的數(shù)據集成模式,再加上大量的各種各樣的外部數(shù)據源,使得組織必須擁有幫助他們從數(shù)據中獲取價值的工具。Hadoop不再被視為“ETL殺手”。如今,新的集成模式如事件流處理、數(shù)據虛擬化、內存和數(shù)據庫處理為數(shù)據集成領域注入了新的活力。就像互聯(lián)網并沒有真正扼殺電視,電視也沒有讓廣播變得毫無用處一樣,數(shù)據整合在今天依然存在。在傳媒業(yè)中,多種媒介并存,成為獲取信息、新聞和娛樂的平行渠道,數(shù)據集成模式一樣,也將百花齊放,百家爭鳴!

        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多