序言 數(shù)據(jù)建模是數(shù)據(jù)治理的一種形式。我們將數(shù)據(jù)治理定義為“執(zhí)行和實(shí)施”對(duì)數(shù)據(jù)和與數(shù)據(jù)有關(guān)的資產(chǎn)的定義、生產(chǎn)和使用的權(quán)威。數(shù)據(jù)的管理從管理數(shù)據(jù)的定義開始。這也是交付高質(zhì)量數(shù)據(jù)模型的最基本目標(biāo)——交付滿足組織需求的高數(shù)據(jù)定義的質(zhì)量。因此,如果您同意我對(duì)數(shù)據(jù)治理的理解,您可能也會(huì)同意數(shù)據(jù)建模本身也是一種治理數(shù)據(jù)的形式,特別是治理數(shù)據(jù)的定義。 數(shù)據(jù)建模與數(shù)據(jù)定義有關(guān),對(duì)組織的數(shù)據(jù)有更重要的影響。數(shù)據(jù)定義的質(zhì)量直接影響數(shù)據(jù)生命周期的許多其他方面。數(shù)據(jù)定義的質(zhì)量影響數(shù)據(jù)的生成方式,并直接影響數(shù)據(jù)在整個(gè)組織中的使用方式。也就是說(shuō)數(shù)據(jù)定義的質(zhì)量直接影響數(shù)據(jù)生產(chǎn)和使用的質(zhì)量。如果數(shù)據(jù)定義的質(zhì)量如此重要,那么我們最好確保執(zhí)行和加強(qiáng)對(duì)定義數(shù)據(jù)的權(quán)限,必須控制如何定義數(shù)據(jù)的過(guò)程。同樣,數(shù)據(jù)建模是必須治理的規(guī)程,這使得數(shù)據(jù)建模成為數(shù)據(jù)治理的一種形式。 數(shù)據(jù)管理的三大方面 面對(duì)數(shù)據(jù)我們只有三個(gè)方面可以做。我已經(jīng)試著讓許多人提出一兩個(gè)不屬于這三個(gè)行動(dòng)的其他措施,然而人們利用數(shù)據(jù)所做的一切都屬于這些類別。這些行動(dòng)包括:定義數(shù)據(jù);產(chǎn)生數(shù)據(jù);使用數(shù)據(jù)。 數(shù)據(jù)治理的前提是,每個(gè)定義、生成和/或使用數(shù)據(jù)的人都必須對(duì)其相關(guān)的行為負(fù)責(zé)。因此,每一個(gè)參與這三種行動(dòng)中的一個(gè)或多個(gè)的人都將成為數(shù)據(jù)的管理者;也就是說(shuō),他們要對(duì)自己的行為負(fù)責(zé)。事實(shí)上,每個(gè)人都是數(shù)據(jù)管家。 本文將從建模如何影響人們對(duì)數(shù)據(jù)采取的三種措施的角度,將數(shù)據(jù)建模視為數(shù)據(jù)治理的一種形式。 一、控制數(shù)據(jù)定義 定義數(shù)據(jù)可能是這三種行動(dòng)中最重要的。有效的管理數(shù)據(jù)定義將提高數(shù)據(jù)生產(chǎn)質(zhì)量和數(shù)據(jù)使用。 嚴(yán)格遵循定義數(shù)據(jù)流程的組織似乎需要管理的數(shù)據(jù)也更少。這可能并不總是事實(shí)——但它確實(shí)有道理。防止創(chuàng)建重復(fù)數(shù)據(jù)集的組織需要管理的數(shù)據(jù)更少。了解整個(gè)組織中定義的所有數(shù)據(jù)集的組織通常能夠更好的處理自然增長(zhǎng)或通過(guò)收購(gòu)或合并增長(zhǎng)的數(shù)據(jù)。 我們可以通過(guò)回答幾個(gè)簡(jiǎn)單的問(wèn)題來(lái)考慮如何管理數(shù)據(jù)定義: 1.您的組織是否將數(shù)據(jù)建模作為定義數(shù)據(jù)過(guò)程的一部分? 2.是否有定義數(shù)據(jù)必須遵循的步驟的流程? 3.這些步驟是否包括獲得客戶對(duì)數(shù)據(jù)定義的驗(yàn)證? 4.最重要的是:您定義的步驟是否被遵循? 這些問(wèn)題集中在管理數(shù)據(jù)定義的最基本操作上。如果您對(duì)第一個(gè)問(wèn)題的回答是“否”,那么您的未建模數(shù)據(jù)要么是完全未治理的,要么是使用內(nèi)部開發(fā)的工具(如電子表格或數(shù)據(jù)字典)來(lái)記錄數(shù)據(jù)的基本質(zhì)量的。數(shù)據(jù)定義的屬性包括業(yè)務(wù)名稱、業(yè)務(wù)定義、有效值和數(shù)據(jù)設(shè)計(jì)的常見(jiàn)屬性,包括數(shù)據(jù)類型、位置等。技術(shù)數(shù)據(jù)定義通常交給數(shù)據(jù)庫(kù)管理員來(lái)構(gòu)建數(shù)據(jù)庫(kù)。 在非結(jié)構(gòu)化數(shù)據(jù)、大數(shù)據(jù)和大量非傳統(tǒng)數(shù)據(jù)源的時(shí)代,管理這些數(shù)據(jù)源的定義并從管理的角度保存這些數(shù)據(jù)源的清單是很重要的。許多組織認(rèn)為非傳統(tǒng)數(shù)據(jù)源的定義者就是“數(shù)據(jù)所有者”。在數(shù)據(jù)治理中,這些人通常被稱為數(shù)據(jù)管理員或數(shù)據(jù)管家。 數(shù)據(jù)定義和數(shù)據(jù)建模是有機(jī)聯(lián)系在一起的。數(shù)據(jù)建模被描述為一系列用于定義支持業(yè)務(wù)流程的數(shù)據(jù)需求的過(guò)程。數(shù)據(jù)建模通常側(cè)重于概念、邏輯和物理數(shù)據(jù)定義,它們分別代表組織在不同抽象級(jí)別上的信息組件。 模型通常會(huì)產(chǎn)生數(shù)據(jù)庫(kù)和數(shù)據(jù)資源,這些數(shù)據(jù)庫(kù)和數(shù)據(jù)資源成為組織信息系統(tǒng)的一部分。 除了遵循標(biāo)準(zhǔn)的數(shù)據(jù)建模約定,數(shù)據(jù)建模最佳實(shí)踐還包括:1)讓正確的人參與定義需求,2)記錄適當(dāng)?shù)臄?shù)據(jù)質(zhì)量(元數(shù)據(jù)),3)解決意見(jiàn)和業(yè)務(wù)理解上的分歧。 第一個(gè)實(shí)踐要求您能夠識(shí)別并在建模過(guò)程的步驟中涉及適當(dāng)?shù)娜藛T?!稊?shù)據(jù)治理權(quán)利法案》(Data Governance Bill of Rights)中,把讓合適的人參與進(jìn)來(lái)是指:找到“正確的”人,在“正確的”時(shí)間參與,以“正確”的方式,使用“正確的”數(shù)據(jù),做出“正確”的決定,找到“正確”的解決方案。 第二個(gè)實(shí)踐側(cè)重于將適當(dāng)?shù)脑獢?shù)據(jù)記錄為數(shù)據(jù)建模過(guò)程的一部分。數(shù)據(jù)模型元數(shù)據(jù)通常包括數(shù)據(jù)質(zhì)量的核心定義,包括業(yè)務(wù)術(shù)語(yǔ)、定義、敏感性和規(guī)則,以及數(shù)據(jù)庫(kù)中數(shù)據(jù)的物理屬性。 第三種實(shí)踐需要一個(gè)受控的流程來(lái)解決關(guān)于如何定義數(shù)據(jù)的業(yè)務(wù)意見(jiàn)上的分歧。企業(yè)管理領(lǐng)域和重要的個(gè)人經(jīng)常有相反或不同的想法,即“數(shù)據(jù)應(yīng)該是什么樣的”,或者數(shù)據(jù)應(yīng)該如何基于他們認(rèn)為對(duì)組織最有利的經(jīng)驗(yàn)來(lái)定義。需要主動(dòng)地處理這些問(wèn)題,以在整個(gè)團(tuán)隊(duì)中建立共同的理解。 二、控制數(shù)據(jù)生成 產(chǎn)生數(shù)據(jù)的行為與定義數(shù)據(jù)的行為直接相關(guān)。數(shù)據(jù)只能在定義數(shù)據(jù)的同時(shí)生成。數(shù)據(jù)可以手工產(chǎn)生或通過(guò)數(shù)據(jù)采集。數(shù)據(jù)定義的質(zhì)量有助于提高對(duì)手工數(shù)據(jù)生成需求的理解。如果負(fù)責(zé)生成數(shù)據(jù)的人員不理解數(shù)據(jù)是如何定義的,那么就很難或不可能滿足手工數(shù)據(jù)生成的需求。由其他數(shù)據(jù)衍生的數(shù)據(jù)通常是組織中最關(guān)鍵的數(shù)據(jù),同時(shí)也是最不容易理解的數(shù)據(jù)。確保清晰定義如何生成、派生、計(jì)算、匹配、排序、組裝和分解數(shù)據(jù)是一種最佳實(shí)踐。最好的實(shí)踐是管理如何定義人造數(shù)據(jù),并讓使用這些數(shù)據(jù)的人直接通過(guò)數(shù)據(jù)庫(kù)或他們收到的報(bào)告獲得該定義。最有價(jià)值的商業(yè)智能數(shù)據(jù)是為用戶目的而制造和定義的數(shù)據(jù)。 在工作中產(chǎn)生數(shù)據(jù)的個(gè)人必須對(duì)產(chǎn)生的數(shù)據(jù)負(fù)責(zé)。這需要對(duì)生成數(shù)據(jù)的過(guò)程進(jìn)行治理。這些流程的治理確保每個(gè)生成數(shù)據(jù)的人都知道并遵循與生成數(shù)據(jù)相關(guān)的規(guī)則。在許多情況下,治理還包括共享數(shù)據(jù)如何使用。 數(shù)據(jù)生產(chǎn)與數(shù)據(jù)建模有著重要的聯(lián)系。對(duì)于一般的業(yè)務(wù)人員來(lái)說(shuō),數(shù)據(jù)建??赡懿粫?huì)對(duì)數(shù)據(jù)的生成產(chǎn)生直接影響。然而,事實(shí)卻恰恰相反。管理數(shù)據(jù)建模的組織會(huì)產(chǎn)生更高質(zhì)量的數(shù)據(jù)。 組織通常依賴于在整個(gè)企業(yè)中流動(dòng)的數(shù)據(jù)。當(dāng)數(shù)據(jù)從數(shù)據(jù)存儲(chǔ)系統(tǒng)移動(dòng)到數(shù)據(jù)存儲(chǔ),或者從數(shù)據(jù)存儲(chǔ)移動(dòng)到商業(yè)智能平臺(tái)時(shí),對(duì)于數(shù)據(jù)的標(biāo)準(zhǔn)和數(shù)據(jù)的質(zhì)量都有相應(yīng)的規(guī)范。如果說(shuō)數(shù)據(jù)建模是數(shù)據(jù)定義的質(zhì)量的核心,則必須使用數(shù)據(jù)模型中的數(shù)據(jù)定義,包括物理屬性、有效值和業(yè)務(wù)定義,以確保數(shù)據(jù)的提供者理解必須如何生成數(shù)據(jù)。如果沒(méi)有對(duì)數(shù)據(jù)的詳細(xì)定義,數(shù)據(jù)生產(chǎn)者就會(huì)盡其所能制造數(shù)據(jù),這可能是業(yè)務(wù)需要的,也可能不是。顯然,受治理的數(shù)據(jù)定義可以提高企業(yè)內(nèi)數(shù)據(jù)的數(shù)據(jù)質(zhì)量。 組織還依賴于外部產(chǎn)生的數(shù)據(jù),以滿足特定的業(yè)務(wù)需求或滿足組織接收數(shù)據(jù)所需的規(guī)范。提高外部數(shù)據(jù)質(zhì)量的這兩種方法。組織要么對(duì)其外部數(shù)據(jù)源有權(quán)力,要么沒(méi)有。當(dāng)組織有權(quán)要求高質(zhì)量的外部數(shù)據(jù),或者它們對(duì)外部數(shù)據(jù)的質(zhì)量有重大影響時(shí),接收方向數(shù)據(jù)生產(chǎn)者提供的受治理業(yè)務(wù)數(shù)據(jù)定義將極大地提高數(shù)據(jù)的質(zhì)量。從對(duì)質(zhì)量沒(méi)有影響的來(lái)源獲取數(shù)據(jù)的組織,通常的做法是使數(shù)據(jù)與他們的數(shù)據(jù)規(guī)范相一致。擁有高質(zhì)量的受治理的業(yè)務(wù)數(shù)據(jù)定義,還可以使所獲得的數(shù)據(jù)與內(nèi)部數(shù)據(jù)規(guī)范保持一致。 高質(zhì)量的業(yè)務(wù)數(shù)據(jù)始于建模時(shí)的數(shù)據(jù)定義。因此,可以說(shuō)數(shù)據(jù)建模是數(shù)據(jù)治理的一種形式。 三、控制數(shù)據(jù)使用 使用數(shù)據(jù)的行為與定義數(shù)據(jù)和生成數(shù)據(jù)的行為直接相關(guān)。數(shù)據(jù)的使用取決于對(duì)他們使用的數(shù)據(jù)的理解。這種理解來(lái)自于在數(shù)據(jù)建?;驍?shù)據(jù)定義過(guò)程中進(jìn)行的高質(zhì)量的數(shù)據(jù)定義。 數(shù)據(jù)使用的風(fēng)險(xiǎn)包括1)保護(hù)敏感數(shù)據(jù)和2)遵循法規(guī)和法律要求的風(fēng)險(xiǎn)管理。讓我們分別處理這些風(fēng)險(xiǎn)管理內(nèi)容。保護(hù)敏感數(shù)據(jù)是一項(xiàng)影響所有業(yè)務(wù)的要求。敏感數(shù)據(jù)包括:個(gè)人身份信息(PII)、受保護(hù)的健康信息(PHI)或知識(shí)產(chǎn)權(quán)(IP)。 ·PII數(shù)據(jù)可以單獨(dú)使用或與其他數(shù)據(jù)一起用于識(shí)別、聯(lián)系或定位某人。 ·PHI數(shù)據(jù)是由組織收集的關(guān)于健康狀態(tài)、醫(yī)療保健或醫(yī)療保健支付的任何數(shù)據(jù),可以與特定的個(gè)人鏈接。 ·知識(shí)產(chǎn)權(quán)數(shù)據(jù)包括商標(biāo)、版權(quán)、專利、設(shè)計(jì)權(quán),在某些司法管轄區(qū)還包括商業(yè)秘密。 高質(zhì)量的數(shù)據(jù)定義包括定義與保護(hù)敏感數(shù)據(jù)相關(guān)的規(guī)則。這些規(guī)則專注于機(jī)密或敏感數(shù)據(jù)的處理。處理規(guī)則包括如何共享、打印、分發(fā)、傳輸、使用和討論敏感數(shù)據(jù)。數(shù)據(jù)治理涉及與保護(hù)敏感數(shù)據(jù)相關(guān)的規(guī)則和流程的執(zhí)行和實(shí)施。 可審計(jì)的遵從性和法規(guī)報(bào)告始于向負(fù)有這些責(zé)任的人員提供對(duì)他們期望遵循的規(guī)則的全面理解。通常,法規(guī)遵循意味著組織必須遵守規(guī)則、政策、標(biāo)準(zhǔn)和法律。數(shù)據(jù)治理就是這些規(guī)則的執(zhí)行和實(shí)施。 數(shù)據(jù)治理要求以一種可理解的方式收集規(guī)則、記錄規(guī)則、批準(zhǔn)規(guī)則、溝通規(guī)則和執(zhí)行規(guī)則。這些操作要求組織實(shí)體(數(shù)據(jù)治理辦公室本身)被賦予執(zhí)行和操作的職責(zé)和權(quán)力。 數(shù)據(jù)使用與數(shù)據(jù)建模也有著關(guān)鍵聯(lián)系。我們已經(jīng)說(shuō)過(guò),數(shù)據(jù)建模對(duì)定義和生成數(shù)據(jù)的有直接和積極影響。使用數(shù)據(jù)的行為也是如此。數(shù)據(jù)建模以及在建模數(shù)據(jù)過(guò)程中收集的元數(shù)據(jù),可以在跨組織使用數(shù)據(jù)時(shí)帶來(lái)一些關(guān)鍵的改進(jìn)。其中有三個(gè)改進(jìn)包括: 1.組織可以提高人們對(duì)使用哪種數(shù)據(jù)的認(rèn)識(shí)。 2.組織可以提高人們對(duì)數(shù)據(jù)本身的理解。 3.組織可以提高人們對(duì)數(shù)據(jù)質(zhì)量需求的認(rèn)識(shí)。 所有這三種改進(jìn)都需要與數(shù)據(jù)建模相關(guān)的治理流程。如前所述,這些數(shù)據(jù)建模流程的治理要求在正確的時(shí)間涉及正確的人員,以正確的方式定義數(shù)據(jù)。正確的方式意味著需要在建模環(huán)境中收集正確的元數(shù)據(jù)。 四、將數(shù)據(jù)治理的重點(diǎn)放在這三個(gè)行動(dòng)上 數(shù)據(jù)治理的前提是:組織中所有定義、產(chǎn)生和/或使用數(shù)據(jù)的人必須1)對(duì)這些數(shù)據(jù)關(guān)系的質(zhì)量負(fù)有正式責(zé)任,2)遵守與這些關(guān)系相關(guān)的規(guī)則。最后一句話中兩個(gè)重要的詞是關(guān)系和規(guī)則。 數(shù)據(jù)治理運(yùn)作的前提是,組織中所有定義、產(chǎn)生和/或使用數(shù)據(jù)的人必須對(duì)這些數(shù)據(jù)關(guān)系的質(zhì)量負(fù)有責(zé)任,并遵守與這些關(guān)系相關(guān)的規(guī)則?!?/p> 數(shù)據(jù)的關(guān)系與人的工作活動(dòng)相關(guān)。根據(jù)這個(gè)推理,把工作分成三個(gè)行動(dòng)相關(guān)的劃分是非常有意義的。 1、數(shù)據(jù)定義 數(shù)據(jù)架構(gòu)師、數(shù)據(jù)建模師、數(shù)據(jù)所有者、系統(tǒng)集成者、數(shù)據(jù)轉(zhuǎn)換主管、項(xiàng)目經(jīng)理、業(yè)務(wù)架構(gòu)師、分析人員和項(xiàng)目代表是與數(shù)據(jù)定義相關(guān)聯(lián)的角色。這些人努力工作,以確保他們定義的數(shù)據(jù)將滿足業(yè)務(wù)需求。 數(shù)據(jù)治理可以幫助這些人:對(duì)于專注于改進(jìn)組織如何定義數(shù)據(jù)的數(shù)據(jù)治理項(xiàng)目,該項(xiàng)目必須為如何定義數(shù)據(jù)提供指導(dǎo)方針和監(jiān)督。這包括開發(fā)和實(shí)施數(shù)據(jù)標(biāo)準(zhǔn)、業(yè)務(wù)術(shù)語(yǔ)、數(shù)據(jù)模型、元數(shù)據(jù)和數(shù)據(jù)字典的指導(dǎo)方針。 2、數(shù)據(jù)生產(chǎn) 系統(tǒng)集成商,獲取數(shù)據(jù)的人,以及為了他們的目的和其他人的目的而獲取和操作數(shù)據(jù)的人是與產(chǎn)生數(shù)據(jù)相關(guān)的角色。這些人努力工作,以確保他們產(chǎn)生高質(zhì)量的數(shù)據(jù),以滿足業(yè)務(wù)需求和實(shí)現(xiàn)業(yè)務(wù)目標(biāo)。 數(shù)據(jù)治理可以幫助這些人:對(duì)于專注于改進(jìn)組織產(chǎn)生數(shù)據(jù)方式的數(shù)據(jù)治理項(xiàng)目,該項(xiàng)目必須為如何產(chǎn)生數(shù)據(jù)提供指導(dǎo)方針和監(jiān)督。這包括制定和實(shí)施數(shù)據(jù)質(zhì)量、數(shù)據(jù)獲取和大數(shù)據(jù)管理的指導(dǎo)方針。 3、數(shù)據(jù)使用 報(bào)告編寫者、分析師、超級(jí)用戶、數(shù)據(jù)科學(xué)家以及在組織的所有級(jí)別使用數(shù)據(jù)回答問(wèn)題和做出決策的人是與使用數(shù)據(jù)相關(guān)的角色。這些人努力工作以確保他們使用數(shù)據(jù)來(lái)滿足他們的團(tuán)隊(duì)和公司的需求和要求。 數(shù)據(jù)治理可以幫助這些人:對(duì)于專注于改進(jìn)組織如何使用數(shù)據(jù)的數(shù)據(jù)治理項(xiàng)目,該項(xiàng)目必須為如何使用數(shù)據(jù)提供指導(dǎo)方針、規(guī)則和監(jiān)督。這包括開發(fā)和執(zhí)行數(shù)據(jù)分類、保護(hù)、遵從性和監(jiān)管報(bào)告關(guān)注的指導(dǎo)方針。 對(duì)于如何將數(shù)據(jù)治理應(yīng)用于這三個(gè)行動(dòng),有兩個(gè)基本類別。這兩類就是主動(dòng)式和響應(yīng)式的數(shù)據(jù)治理。理想情況下,兩者都將在組織內(nèi)實(shí)現(xiàn)。 主動(dòng)式數(shù)據(jù)治理是將治理數(shù)據(jù)的行為構(gòu)建到流程中。主動(dòng)數(shù)據(jù)治理的是徹底將數(shù)據(jù)治理考慮添加到系統(tǒng)開發(fā)方法中。通過(guò)將關(guān)注數(shù)據(jù)治理的活動(dòng)插入到系統(tǒng)開發(fā)方法論的步驟中,可以假定這些步驟將隨著方法論的遵循而完成。 響應(yīng)式數(shù)據(jù)治理是開發(fā)可重復(fù)的流程,并為特定角色指定責(zé)任,以便在需要解決與數(shù)據(jù)相關(guān)的問(wèn)題時(shí)作出響應(yīng)。響應(yīng)式數(shù)據(jù)治理是把數(shù)據(jù)問(wèn)題收集和解決過(guò)程的開發(fā),處理訪問(wèn)敏感數(shù)據(jù)請(qǐng)求的過(guò)程的開發(fā),以及獲取啟用數(shù)據(jù)功能包或工具的過(guò)程。 五、使用建模工具建模和管理數(shù)據(jù) 數(shù)據(jù)治理只能在對(duì)數(shù)據(jù)和流程進(jìn)行建模的組織中有效地完成。它不是一次性的活動(dòng);數(shù)據(jù)治理是一項(xiàng)持續(xù)的活動(dòng),必須在保證遵從性的同時(shí)對(duì)更改做出響應(yīng)。為了建立對(duì)GDPR、HIPAA、SOX、PCI DSS等法規(guī)的遵從性,企業(yè)需要知道哪些數(shù)據(jù)是敏感的,誰(shuí)有權(quán)訪問(wèn)這些數(shù)據(jù),并能夠提供關(guān)于整個(gè)數(shù)據(jù)沿襲所做的任何更改的詳細(xì)報(bào)告,尤其是跨國(guó)企業(yè)。組織需要有效地計(jì)劃、管理、監(jiān)視和控制對(duì)數(shù)據(jù)的訪問(wèn),無(wú)論數(shù)據(jù)來(lái)自內(nèi)部還是外部。 數(shù)據(jù)建模工具需要包括用于邏輯和物理數(shù)據(jù)建模(數(shù)據(jù)架構(gòu)師)、業(yè)務(wù)流程和概念建模(業(yè)務(wù)架構(gòu)師)的工具、共享模型和元數(shù)據(jù)存儲(chǔ)庫(kù)以及用于業(yè)務(wù)詞匯和術(shù)語(yǔ)的協(xié)作門戶(Team Server)。能夠容易地定義模型和元數(shù)據(jù)、跟蹤對(duì)模型和業(yè)務(wù)術(shù)語(yǔ)表的更改、定義企業(yè)架構(gòu)以有效地跨整個(gè)組織管理數(shù)據(jù),并為數(shù)據(jù)治理活動(dòng)建立堅(jiān)實(shí)的基礎(chǔ)。 通過(guò)協(xié)作功能和對(duì)數(shù)據(jù)模型和詞匯表的訪問(wèn),加快決策過(guò)程,并提高整個(gè)組織的數(shù)據(jù)質(zhì)量。業(yè)務(wù)分析師和架構(gòu)師可以定義業(yè)務(wù)流程,與參與元數(shù)據(jù)定義工作流的數(shù)據(jù)專業(yè)人員協(xié)作,并根據(jù)需求在適當(dāng)?shù)募?jí)別訪問(wèn)有關(guān)模型和元數(shù)據(jù)的信息。數(shù)據(jù)建模師和架構(gòu)師可以記錄和共享模型、元數(shù)據(jù)和報(bào)告,并在統(tǒng)一的企業(yè)術(shù)語(yǔ)表上與業(yè)務(wù)涉眾協(xié)作,這些術(shù)語(yǔ)表使用的元數(shù)據(jù)術(shù)語(yǔ)和定義可以跨多個(gè)數(shù)據(jù)庫(kù)平臺(tái)和應(yīng)用程序一致使用。 數(shù)據(jù)沿襲顯示了數(shù)據(jù)在組織中的移動(dòng)。當(dāng)數(shù)據(jù)在組織中移動(dòng)時(shí),它捕獲真實(shí)的來(lái)源,并描述相關(guān)的來(lái)源、目標(biāo)和轉(zhuǎn)換。數(shù)據(jù)建模工具需要?jiǎng)?chuàng)建一個(gè)圖來(lái)顯示模型中的這些轉(zhuǎn)換,其中包括關(guān)系、非結(jié)構(gòu)化和ETL數(shù)據(jù)源。通過(guò)合并不同的數(shù)據(jù)源和支持?jǐn)?shù)據(jù)沿襲來(lái)跟蹤數(shù)據(jù)移動(dòng),使數(shù)據(jù)專業(yè)人員能夠有效地記錄和理解他們的數(shù)據(jù)環(huán)境,并建立一個(gè)有效的企業(yè)架構(gòu),使他們能夠?qū)崿F(xiàn)業(yè)務(wù)目標(biāo)。 六、為什么說(shuō)數(shù)據(jù)建模是數(shù)據(jù)治理的一種形式 事實(shí)是,整體而言數(shù)據(jù)建模本身并不是數(shù)據(jù)治理。但是數(shù)據(jù)建模是數(shù)據(jù)治理的一種形式。 數(shù)據(jù)建模是一門數(shù)據(jù)學(xué)科。通過(guò)數(shù)據(jù)建模,可以設(shè)計(jì)組織的數(shù)據(jù)、減少冗余、遵循標(biāo)準(zhǔn),并為數(shù)據(jù)構(gòu)建對(duì)業(yè)務(wù)有用的定義。數(shù)據(jù)建模的作用遠(yuǎn)不止于此。 數(shù)據(jù)建模的使用因組織而異。一些組織擁有企業(yè)數(shù)據(jù)模型(EDM),它們被構(gòu)建來(lái)設(shè)計(jì)整個(gè)組織的數(shù)據(jù)。開發(fā)EDM通常是一項(xiàng)艱巨的任務(wù),需要大量的業(yè)務(wù)和技術(shù)人員參與討論組織的詳細(xì)數(shù)據(jù)和信息需求。有些人認(rèn)為企業(yè)模型是開始改進(jìn)整個(gè)組織的數(shù)據(jù)和數(shù)據(jù)質(zhì)量的地方。有些人認(rèn)為EDM是定義和解決企業(yè)整體數(shù)據(jù)需求的一個(gè)步驟。還有一些人認(rèn)為開發(fā)EDM是在浪費(fèi)時(shí)間。有的組織為其內(nèi)部開發(fā)的信息系統(tǒng)和/或數(shù)據(jù)倉(cāng)庫(kù)或業(yè)務(wù)智能環(huán)境中的數(shù)據(jù)建模數(shù)據(jù)。通常,這些模型比EDM要小,并且是為特定目的而構(gòu)建的——盡管許多組織選擇重用現(xiàn)有模型的來(lái)創(chuàng)建新模型。有的組織購(gòu)買行業(yè)數(shù)據(jù)模型,遵循所描述的用于生成數(shù)據(jù)模型的模式,或者在定義、生成和使用數(shù)據(jù)的設(shè)計(jì)階段獲取和放置規(guī)則。數(shù)據(jù)建模現(xiàn)在或過(guò)去被視為組織數(shù)據(jù)管理活動(dòng)的基礎(chǔ)。同樣,數(shù)據(jù)建模是關(guān)于數(shù)據(jù)紀(jì)律的。 創(chuàng)建數(shù)據(jù)模型有很多原因。這些原因包括遵循數(shù)據(jù)標(biāo)準(zhǔn)、減少冗余、將業(yè)務(wù)定義用于數(shù)據(jù),以及如何更好地定義數(shù)據(jù)或?qū)?shù)據(jù)定義作為重要資產(chǎn)進(jìn)行管理。 “毫無(wú)疑問(wèn),數(shù)據(jù)建模既是一門藝術(shù),也是一門科學(xué)?!?/strong> 對(duì)數(shù)據(jù)建模的主要原因是為了向組織灌輸關(guān)于定義數(shù)據(jù)的規(guī)程。 行業(yè)實(shí)踐表明,數(shù)據(jù)建模是一種用于定義和分析支持組織信息系統(tǒng)內(nèi)業(yè)務(wù)流程所需的數(shù)據(jù)需求的過(guò)程;數(shù)據(jù)建模的過(guò)程涉及專業(yè)數(shù)據(jù)建模師與業(yè)務(wù)涉眾以及數(shù)據(jù)和信息系統(tǒng)的潛在用戶密切合作。 數(shù)據(jù)建模大師Steve Hoberman認(rèn)為,數(shù)據(jù)建模是學(xué)習(xí)數(shù)據(jù)的過(guò)程,數(shù)據(jù)模型是數(shù)據(jù)建模過(guò)程的結(jié)果。 那么,為什么我說(shuō)數(shù)據(jù)建模是數(shù)據(jù)治理的一種形式呢?數(shù)據(jù)治理是對(duì)數(shù)據(jù)管理權(quán)限的執(zhí)行和強(qiáng)制執(zhí)行。數(shù)據(jù)建模可以看作是對(duì)數(shù)據(jù)定義的權(quán)限的執(zhí)行和實(shí)施。數(shù)據(jù)建模的規(guī)程包括“正確的”人在“正確的”時(shí)間為組織定義“正確的”數(shù)據(jù)。這就是數(shù)據(jù)治理的本質(zhì)。 七、綜述 數(shù)據(jù)建模是數(shù)據(jù)治理的一種形式或者至少是數(shù)據(jù)治理的一部分,因?yàn)樗枰o(jì)律,這對(duì)于確保數(shù)據(jù)的設(shè)計(jì)符合需要是必要的。不為數(shù)據(jù)建模的組織更難從數(shù)據(jù)中獲得價(jià)值,因?yàn)樗鼈兊臄?shù)據(jù)充滿了不一致性和誤解。詢問(wèn)任何沒(méi)有對(duì)數(shù)據(jù)建模的組織,他們的數(shù)據(jù)是否被治理,答案肯定是“不”。 |
|
來(lái)自: 數(shù)據(jù)治理精英館 > 《待分類》