數(shù)據(jù)目錄解決方案旨在處理關(guān)鍵的數(shù)據(jù)管理問題,對(duì)于構(gòu)建了數(shù)據(jù)湖或大數(shù)據(jù)平臺(tái)的大型企業(yè)而言,弄清公司擁有哪些數(shù)據(jù)是極具挑戰(zhàn)性的工作。即使組織知道他們擁有什么數(shù)據(jù),也不總是知道哪些數(shù)據(jù)集是可信任的,哪些數(shù)據(jù)集的可靠性較差。在這種情況下,數(shù)據(jù)湖變得更像數(shù)據(jù)沼澤。 數(shù)據(jù)目錄工具可自動(dòng)發(fā)現(xiàn)整個(gè)企業(yè)信息系統(tǒng)中的數(shù)據(jù)源。然后,它使用元數(shù)據(jù)管理功能來組織數(shù)據(jù),顯示不同數(shù)據(jù)之間的關(guān)系,通過搜索并跟蹤數(shù)據(jù)沿襲。許多工具還包括數(shù)據(jù)治理功能并支持用戶自助服務(wù),其中一些還包括詞匯表,以便用戶對(duì)術(shù)語有共同的理解。 目前,大多數(shù)數(shù)據(jù)目錄工具具有人工智能(AI)和機(jī)器學(xué)習(xí)(ML)功能。ML通常會(huì)提供一個(gè)可信評(píng)分,以顯示數(shù)據(jù)的可靠性,同時(shí)還可以提供一些建議并進(jìn)行基本分析。 一、如何選擇數(shù)據(jù)目錄軟件 如果您正在選擇數(shù)據(jù)目錄工具,請(qǐng)牢記以下提示:
二、十大數(shù)據(jù)目錄軟件
作為一家純粹的數(shù)據(jù)治理和數(shù)據(jù)目錄供應(yīng)商,Alation聲稱是“業(yè)界領(lǐng)先的數(shù)據(jù)目錄”。它在64個(gè)國(guó)家/地區(qū)擁有300,000多個(gè)訂戶,其客戶包括Finnair,Blackstone,澳大利亞國(guó)防部,陶氏化學(xué),Albertsons,百事可樂,Expedia,PNC,美國(guó)運(yùn)通,General Mills等。它獲得了無數(shù)贊譽(yù),包括2020年KMWorld客戶選擇獎(jiǎng),2020年Gartner Peer Insights客戶選擇獎(jiǎng),并在2020年被評(píng)為Forrester Wave機(jī)器學(xué)習(xí)數(shù)據(jù)目錄的領(lǐng)導(dǎo)者。 Alation數(shù)據(jù)目錄的主要功能包括行為智能,無縫協(xié)作,引導(dǎo)式導(dǎo)航,數(shù)據(jù)治理功能以及與流行的大數(shù)據(jù)和BI工具以及API和Open Connector SDK的連接。它還為金融,醫(yī)療保健,保險(xiǎn),制造,零售和技術(shù)公司提供量身定制的解決方案。此外,它還有一個(gè)龐大的合作伙伴生態(tài)系統(tǒng),其中包括系統(tǒng)集成商,代理商和技術(shù)供應(yīng)商??筛鶕?jù)要求提供定價(jià)。該公司提供現(xiàn)場(chǎng)演示,并可以要求進(jìn)行個(gè)性化演示。 優(yōu)點(diǎn)
缺點(diǎn)
總部位于澳大利亞的Alex Solutions將其產(chǎn)品描述為一種元數(shù)據(jù)管理解決方案,其中包含了數(shù)據(jù)目錄和數(shù)據(jù)治理功能。它主要為金融、電信,零售和公用事業(yè)領(lǐng)域的企業(yè)提供服務(wù),并在澳大利亞、歐洲、美洲和亞洲擁有客戶。Gartner和Forrester已將其評(píng)為市場(chǎng)領(lǐng)導(dǎo)者。 Alex提供數(shù)據(jù)目錄,業(yè)務(wù)詞匯表,策略驅(qū)動(dòng)的數(shù)據(jù)質(zhì)量,智能標(biāo)記,與技術(shù)無關(guān)的元數(shù)據(jù)掃描和工作流功能。它的元數(shù)據(jù)管理功能可用于數(shù)據(jù)清單,使用情況分析,敏感性檢測(cè),數(shù)據(jù)沿襲支持,風(fēng)險(xiǎn)管理等。它的機(jī)器學(xué)習(xí)功能非常先進(jìn),并且具有直觀的界面。演示和價(jià)格可根據(jù)要求提供。 優(yōu)點(diǎn)
缺點(diǎn)
Collibra旨在通過其數(shù)據(jù)智能云,平臺(tái),數(shù)據(jù)目錄,數(shù)據(jù)治理,數(shù)據(jù)沿襲和數(shù)據(jù)隱私產(chǎn)品使數(shù)據(jù)有意義。它的客戶包括Adobe,AXA XL,DNB,Equifax,霍尼韋爾,NetApp,阿斯利康,瑞士信貸,戴爾,T-Mobile,摩根大通,Progressive,Cigna,洛克希德·馬丁,Verizon等。Forrester和Gartner都將該公司評(píng)為領(lǐng)導(dǎo)者,并且還獲得了《福布斯》,《商業(yè)內(nèi)幕》,Datanami,Battery Ventures等公司的獎(jiǎng)項(xiàng)。 Collibra的數(shù)據(jù)目錄產(chǎn)品包括廣泛的本地連接,基于ML的自動(dòng)化,數(shù)據(jù)評(píng)分和嵌入式數(shù)據(jù)治理功能。定價(jià)和演示可根據(jù)要求提供。 優(yōu)點(diǎn)
缺點(diǎn)
Data.world是專注于數(shù)據(jù)目錄功能的純供應(yīng)商。它的客戶包括AP,Mirum,WPP,Yonder等。Forrester將其命名為“杰出表現(xiàn)者”,而Gartner則將其稱為“挑戰(zhàn)者”。 作為云技術(shù)的本地產(chǎn)品,Data.world提供上下文數(shù)據(jù)分類,其中包括元數(shù)據(jù),儀表板,分析,代碼,文檔,項(xiàng)目管理和社交協(xié)作功能。它還結(jié)合了知識(shí)圖技術(shù)并提供實(shí)時(shí)集成功能。此外,該公司遵循敏捷開發(fā)流程,不斷發(fā)布更新和功能改進(jìn)。 與許多其他數(shù)據(jù)目錄供應(yīng)商不同,Data.world在其網(wǎng)站上發(fā)布其定價(jià)。企業(yè)版產(chǎn)品包括Essentials(每年50,000美元及以上),Standard(每年100,000美元及以上),Premier(每個(gè)150,000美元)年及以上)和Premier Plus(自定義定價(jià))。提供演示和免費(fèi)試用版。 優(yōu)點(diǎn)
缺點(diǎn)
Erwin以前是CA Technologies的一部分,后來被Quest Software收購,他專注于企業(yè)數(shù)據(jù)治理體驗(yàn)(EDGE)的產(chǎn)品,包括業(yè)務(wù)流程建模,企業(yè)體系結(jié)構(gòu),數(shù)據(jù)建模,數(shù)據(jù)目錄和數(shù)據(jù)文化。它已經(jīng)運(yùn)營(yíng)了三十多年,其客戶包括Adecco,Balfour Beatty Construction,CenturyLink,F(xiàn)idelity International,蘇格蘭皇家銀行等。它贏得了無數(shù)贊譽(yù),包括被Gartner任命為L(zhǎng)eader以及被Forrester提名為Contender。 Erwin將Data Catalog(DC)作為獨(dú)立產(chǎn)品或作為其Data Intelligence套件的一部分提供。Erwin DC的好處包括集中的數(shù)據(jù)治理框架,元數(shù)據(jù)驅(qū)動(dòng)的方法,加快的項(xiàng)目交付,提高的數(shù)據(jù)質(zhì)量,法規(guī)遵從性和準(zhǔn)確的分析。它包括元數(shù)據(jù)管理,映射管理,參考數(shù)據(jù)管理,生命周期管理,業(yè)務(wù)數(shù)據(jù)概要分析和數(shù)據(jù)集成。某些Erwin產(chǎn)品的價(jià)格可在線獲得,但對(duì)于Data Intelligence和Data Catalog產(chǎn)品,則需要聯(lián)系代表??梢悦赓M(fèi)試用。 優(yōu)點(diǎn)
缺點(diǎn)
Google Cloud Data Catalog是Google Cloud數(shù)據(jù)分析產(chǎn)品的一部分,是一項(xiàng)具有數(shù)據(jù)發(fā)現(xiàn)和元數(shù)據(jù)管理功能的完全托管的云服務(wù)。它可在全球23個(gè)不同地區(qū)使用。Google還與Collibra,Tableau和Informatica建立了戰(zhàn)略合作伙伴關(guān)系。 該服務(wù)的主要功能包括無服務(wù)器架構(gòu),元數(shù)據(jù)即服務(wù),中央目錄,搜索和發(fā)現(xiàn),模式化元數(shù)據(jù),云DLP集成,本地連接,云身份和訪問管理(IAM)集成和治理功能。它提供了一個(gè)多維搜索界面,元數(shù)據(jù)同步和標(biāo)記,易于擴(kuò)展的功能以及與云數(shù)據(jù)丟失防護(hù)(DLP)和其他Google Cloud服務(wù)的集成。 定價(jià)可從網(wǎng)站上獲得,但有些復(fù)雜。每月最多可免費(fèi)存儲(chǔ)1 MiB,超出的每個(gè)GiB每月收費(fèi)100美元。前100萬次API調(diào)用是免費(fèi)的,之后每10萬次API調(diào)用費(fèi)用為10美元。新客戶還可以使用Google Cloud的免費(fèi)試用版。 優(yōu)點(diǎn)
缺點(diǎn)
由Pentaho,Hitachi Data Systems和Hitachi Insight Group合并而成,Hitachi Vantara出售存儲(chǔ)硬件,融合和超融合基礎(chǔ)設(shè)施,物聯(lián)網(wǎng)(IoT)解決方案,視頻智能,IT運(yùn)營(yíng)管理軟件和數(shù)據(jù)保護(hù)軟件以及數(shù)據(jù)管理和分析軟件。其Lumada數(shù)據(jù)目錄軟件是其數(shù)據(jù)管理和分析產(chǎn)品的一部分,Kaiser Permanente,F(xiàn)annie Mae和Johnson Controls等組織都在使用該軟件。Forrester將Lumada Data Catalog評(píng)為杰出表現(xiàn)者。 基于Hitachi Vantara購買Waterline Data時(shí)獲得的技術(shù),Lumada Data Catalog提供了非常先進(jìn)的機(jī)器學(xué)習(xí)和行為智能功能。它保證了更快的數(shù)據(jù)標(biāo)記,并包括AI驅(qū)動(dòng)的發(fā)現(xiàn),端到端數(shù)據(jù)沿襲,自助數(shù)據(jù)訪問,敏感數(shù)據(jù)管理和跨部門協(xié)作等功能??筛鶕?jù)要求提供定價(jià)和演示。 優(yōu)點(diǎn)
缺點(diǎn)
Infogix成立于1982年,當(dāng)時(shí)是一家名為Unitech Systems的風(fēng)險(xiǎn)與合規(guī)軟件供應(yīng)商,現(xiàn)在提供一個(gè)名為Data360的數(shù)據(jù)智能平臺(tái),該平臺(tái)包括數(shù)據(jù)目錄,數(shù)據(jù)治理,數(shù)據(jù)質(zhì)量和數(shù)據(jù)分析功能。它的客戶包括Total Health Care,Swedbank,Keurig和Johnson&Johnson。Gartner將該公司命名為“挑戰(zhàn)者”,而Forrester則稱其為競(jìng)爭(zhēng)者。 Data360中的關(guān)鍵數(shù)據(jù)目錄功能包括自動(dòng)元數(shù)據(jù)管理,基于機(jī)器學(xué)習(xí)的搜索和發(fā)現(xiàn),智能業(yè)務(wù)詞匯表,數(shù)據(jù)沿襲,影響分析等。該公司還提供專業(yè)服務(wù),培訓(xùn)和支持。演示和價(jià)格可根據(jù)要求提供。 優(yōu)點(diǎn)
缺點(diǎn)
作為最著名的數(shù)據(jù)目錄供應(yīng)商之一,Informatica提供了一個(gè)智能數(shù)據(jù)平臺(tái),該平臺(tái)集成了多種基于云的企業(yè)數(shù)據(jù)管理產(chǎn)品。其數(shù)據(jù)目錄客戶包括Avis預(yù)算集團(tuán),AXA XL,禮來公司,洛杉磯汽車,友邦保險(xiǎn)新加坡和方濟(jì)各會(huì)聯(lián)盟。Gartner連續(xù)五年將公司評(píng)為領(lǐng)導(dǎo)者。Forrester將其列為有力競(jìng)爭(zhēng)者。 Informatica的企業(yè)數(shù)據(jù)目錄提供了利用AI技術(shù)的企業(yè)范圍數(shù)據(jù)發(fā)現(xiàn)功能。它在其業(yè)務(wù)環(huán)境中提供了數(shù)據(jù)的整體視圖。關(guān)鍵功能包括AI驅(qū)動(dòng)的自動(dòng)化,數(shù)據(jù)供應(yīng),端到端數(shù)據(jù)沿襲,集成的數(shù)據(jù)質(zhì)量功能和協(xié)作能力。可根據(jù)要求提供定價(jià)。Informatica提供了一些工具的免費(fèi)試用版,但沒有提供數(shù)據(jù)目錄。 優(yōu)點(diǎn)
缺點(diǎn)
過去,IBM作為其InfoSphere產(chǎn)品線的一部分提供本地?cái)?shù)據(jù)目錄軟件,但是目前它主要專注于基于云的IBM Watson Knowledge Catalog。使用該服務(wù)的組織包括Danske銀行和Standard Bank Group。Gartner和Forrester均將IBM評(píng)為該市場(chǎng)的領(lǐng)導(dǎo)者,該工具還獲得了2020年Gartner Peer Insights客戶選擇獎(jiǎng)。 可以通過IBM Cloud Pak for Data將IBM Watson Knowledge Catalog部署在IBM Cloud或私有云上。值得注意的功能包括智能發(fā)現(xiàn)建議,端到端目錄,自動(dòng)化數(shù)據(jù)治理,數(shù)據(jù)沿襲,質(zhì)量得分和自助服務(wù)。它還包括數(shù)據(jù)質(zhì)量,協(xié)作和合規(guī)性功能。 如果要在IBM Cloud Pak for Data上部署IBM Watson Knowledge Catalog,則需要與公司聯(lián)系以進(jìn)行定價(jià)。如果您在IBM Cloud上將其作為服務(wù)購買,則可以選擇三種不同的定價(jià)級(jí)別:精簡(jiǎn)版(免費(fèi)),標(biāo)準(zhǔn)版(每實(shí)例300美元,每容量單位小時(shí)0.50美元,每增加一個(gè)用戶50美元)和專業(yè)版(7,000美元)每個(gè)實(shí)例,每個(gè)容量單位小時(shí)$ 0.40,每個(gè)額外用戶$ 300)。 優(yōu)點(diǎn)
缺點(diǎn)
三、數(shù)據(jù)目錄軟件比較 |
|