2004-12-3 18:20:23 秦磊 趙亮/KMCenter
雖然一提到數(shù)據(jù)管理,大家首先想到的是數(shù)據(jù)庫技術(shù),但實(shí)際上這只為企業(yè)解決了15%的結(jié)構(gòu)化數(shù)據(jù)管理問題,85%的非結(jié)構(gòu)化數(shù)據(jù)怎么來管呢?這也就是企業(yè)內(nèi)容管理軟件的職能所在。 需求篇 信息激增催生內(nèi)容管理
在當(dāng)今信息爆炸的時(shí)代,信息每天都在以驚人的速度增長(zhǎng)。有統(tǒng)計(jì)表明,來自交易中的數(shù)據(jù)每年增長(zhǎng)的速度達(dá)到61%,而其他各種相關(guān)信息的每年增長(zhǎng)率甚至超過92%。同時(shí),信息的種類也在不斷地?cái)U(kuò)展,越來越多的非結(jié)構(gòu)化信息不斷出現(xiàn),包括企業(yè)的各種報(bào)表、賬單、電子文檔、網(wǎng)站的各種元素、圖片、傳真、掃描影像,以及大量的多媒體的音頻、視頻信息等等。而信息爆炸的背后,我們面臨的巨大挑戰(zhàn)是如何有序地存儲(chǔ)、管理并利用這些信息,尤其是對(duì)于那些大量的、非結(jié)構(gòu)化的信息。如果一個(gè)企業(yè)無法將這些信息進(jìn)行有系統(tǒng)地編目和管理,則隨之面臨的危機(jī)是不斷流失的生產(chǎn)力。另一個(gè)統(tǒng)計(jì)數(shù)字值得我們深思,企業(yè)員工為了完成自己的工作而用于尋找信息的時(shí)間平均占整個(gè)工作時(shí)間的30%,這等于將員工每周40個(gè)小時(shí)的工作時(shí)間縮減為28個(gè)小時(shí)。沒有一個(gè)公司允許員工每年用30%的時(shí)間去休假,然而現(xiàn)在,這是一個(gè)很多企業(yè)和組織不得不面對(duì)的現(xiàn)實(shí)。從另一方面,企業(yè)和組織也希望對(duì)這些信息有更多的控制,保障信息的安全,挖掘信息的價(jià)值。 在過去幾年中, 我們接觸過許多不同行業(yè)的客戶對(duì)于內(nèi)容管理方面的各種需求, 并成功與客戶一起實(shí)施了許多企業(yè)內(nèi)容管理應(yīng)用。在我們?cè)噲D為企業(yè)內(nèi)容管理明確一個(gè)定義之前,不妨讓我們從幾個(gè)實(shí)際的案例來分析客戶對(duì)于企業(yè)內(nèi)容管理的需求。 用戶1:中國銀行廣州分行 中國銀行廣州分行,從1998年開始實(shí)施電子報(bào)表管理應(yīng)用。而在此之前,所有的報(bào)表都是打印到紙張上,每年用于打印的開銷超過600萬人民幣。廣州中行在進(jìn)行系統(tǒng)選型時(shí)要求,應(yīng)用的平臺(tái)必須基于成熟的技術(shù),支持開放的標(biāo)準(zhǔn),可以支持從PC到Unix系統(tǒng)到AS/400到ES/9000等各種硬件平臺(tái),支持存儲(chǔ)管理各個(gè)業(yè)務(wù)系統(tǒng)各種報(bào)表。系統(tǒng)要求具有工業(yè)化強(qiáng)度、可擴(kuò)展性,適應(yīng)中行的大集中模式。今天,基于內(nèi)容管理平臺(tái),中國銀行廣州分行的電子報(bào)表管理系統(tǒng)已經(jīng)成功實(shí)施并經(jīng)歷了三個(gè)發(fā)展階段,即從廣州市行擴(kuò)展到廣東省行再擴(kuò)展到華南區(qū)域中心。目前,該系統(tǒng)支持存儲(chǔ)管理華南中心下轄五省一市的來自各個(gè)業(yè)務(wù)系統(tǒng)(包括會(huì)計(jì)、零售、信用卡、信貸、消費(fèi)信貸、國際結(jié)算、收付清算、 電話銀行、基金、中間業(yè)務(wù)、NETS、SCAN、EFT、BEPS、ATM、POS等)的394種報(bào)表,支持超過1000個(gè)用戶的并發(fā)訪問。通過多層級(jí)存儲(chǔ)管理,報(bào)表可以被自動(dòng)遷移到光盤庫中保存15年或者永久保存。目前,中國銀行還希望基于該系統(tǒng)管理更多類型的內(nèi)容,包括各種影像單證、OA系統(tǒng)的公文和電子文檔等。 用戶2:北京移動(dòng)通信公司 北京移動(dòng)通信公司需要提供話費(fèi)詳單的多種服務(wù)渠道,包括郵寄、營(yíng)業(yè)廳、1860、Internet等等,而原來每個(gè)服務(wù)渠道都有各自處理詳單的方式,造成系統(tǒng)壓力、響應(yīng)時(shí)間、運(yùn)營(yíng)成本、客戶服務(wù)等多方面的問題。今天,基于IBM的內(nèi)容管理軟件,北京移動(dòng)成功實(shí)施了統(tǒng)一的詳單管理平臺(tái),實(shí)現(xiàn)了詳單的海量存儲(chǔ)。通過高效壓縮,系統(tǒng)可以節(jié)省超過90%的存儲(chǔ)成本,而詳單的保存時(shí)間可以支持2年甚至更長(zhǎng)的時(shí)間。即便在峰值時(shí),查詢的時(shí)間也僅在1到2秒鐘。這樣一個(gè)統(tǒng)一的平臺(tái)目前可以支持營(yíng)業(yè)廳、1860、Internet以及安全保衛(wèi)部門等多渠道的詳單服務(wù),在實(shí)現(xiàn)系統(tǒng)響應(yīng)時(shí)間縮短、客戶服務(wù)質(zhì)量提升的同時(shí),還大大節(jié)省了運(yùn)營(yíng)的成本。在擴(kuò)展性上,該系統(tǒng)可以很好地支持北京移動(dòng)未來的個(gè)性化詳單服務(wù)要求。 用戶3:某圖書館 某圖書館的實(shí)驗(yàn)型數(shù)字圖書館系統(tǒng),需要發(fā)布6000張拓片,最初采用的方式是基于數(shù)據(jù)庫加上Web服務(wù)器進(jìn)行自主開發(fā)。數(shù)據(jù)庫采用12個(gè)字段描述關(guān)于拓片的索引信息,而最后一個(gè)字段是URL地址,對(duì)應(yīng)Web服務(wù)器的文件目錄、子目錄、文件名,每條記錄對(duì)應(yīng)三個(gè)圖片,分別為150DPI的高分辨率JPEG圖、 75DPI的中分辨率JPEG圖以及拇指圖,這三張圖片都是從平均大小為7M左右的TIFF轉(zhuǎn)換得到的。該系統(tǒng)上線后,業(yè)務(wù)部門提出了很多新的需求,他們希望能夠通過層次存儲(chǔ)管理原始的TIFF圖片,能夠支持更復(fù)雜的層次型元數(shù)據(jù)描述,以提升拓片的價(jià)值;他們希望將系統(tǒng)從單純的圖片發(fā)布平臺(tái)擴(kuò)展為拓片的專業(yè)研究平臺(tái),可以增加關(guān)于拓片各種背景資料、專家研究文檔;希望支持工作流,以實(shí)現(xiàn)對(duì)拓片的專業(yè)化標(biāo)引流程;通過水印等技術(shù)實(shí)現(xiàn)拓片信息的版權(quán)保護(hù)。系統(tǒng)本身也需要從底層解決元數(shù)據(jù)和拓片影像之間的一致性、完整性保障,保證系統(tǒng)的安全性;支持參量檢索、全文檢索等多渠道復(fù)合檢索方式。現(xiàn)在,該圖書館已經(jīng)開始通過內(nèi)容管理軟件管理拓片、電子圖書、博士論文、音頻、視頻等各種多媒體數(shù)字資源,實(shí)施了八個(gè)數(shù)字資源子系統(tǒng)。 在上面的幾個(gè)案例中,我們談到了報(bào)表、賬單、影像、電子文檔、圖片、音頻、視頻等各種信息,這些信息都是非結(jié)構(gòu)化的大對(duì)象,難以用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫管理,我們將這些非結(jié)構(gòu)化的信息稱為內(nèi)容(Content)。而上述的各種客戶需求也反映了客戶對(duì)于內(nèi)容管理系統(tǒng)的基本需求,包括基于成熟開放的技術(shù)、標(biāo)準(zhǔn);支持各種硬件環(huán)境、提供從部門級(jí)應(yīng)用到企業(yè)級(jí)應(yīng)用的擴(kuò)展;具有高可用性、安全性、工業(yè)化強(qiáng)度;支持多層級(jí)海量存儲(chǔ)管理、強(qiáng)大的開發(fā)能力;保證信息的一致性、完整性、靈活的數(shù)據(jù)模型、工作流、數(shù)字版權(quán)保護(hù)等等。 平臺(tái)是主流 明確了企業(yè)內(nèi)容管理,認(rèn)識(shí)到平臺(tái)的重要性,那么到底何處入手了解、掌握并開發(fā)出適合您的企業(yè)內(nèi)容管理應(yīng)用呢?最好的方式是從成熟商業(yè)軟件入手。 一個(gè)統(tǒng)一、完整、集成、開放、 可擴(kuò)展的內(nèi)容管理架構(gòu)應(yīng)該包含以下內(nèi)容: 我們就其中的一些重點(diǎn)技術(shù)做詳細(xì)的探討。 1、系統(tǒng)架構(gòu) 對(duì)于任何平臺(tái)來說,良好的架構(gòu)對(duì)于系統(tǒng)的重要性是不言而喻的,尤其是企業(yè)內(nèi)容管理系統(tǒng)。內(nèi)容管理平臺(tái)軟件需要考慮如何實(shí)現(xiàn)靈活高效的數(shù)據(jù)模型,如何設(shè)計(jì)各種語言的API接口,如何實(shí)現(xiàn)完善的訪問控制管理,以及如何架構(gòu)系統(tǒng)的拓?fù)湟酝瓿蓴?shù)據(jù)遷移、緩存,如何支持PB級(jí)的存儲(chǔ)和上千的并發(fā)用戶。企業(yè)內(nèi)容管理尤其需要考慮到未來的擴(kuò)展能力,如何在最大化保護(hù)用戶現(xiàn)有投資的情況下,提供無限的可擴(kuò)展空間。由于企業(yè)內(nèi)容管理牽涉的范圍太廣,使得平臺(tái)在選擇技術(shù)時(shí),必須使用大量的成熟穩(wěn)定的技術(shù),而且必須符合業(yè)界標(biāo)準(zhǔn)。此外,當(dāng)這些技術(shù)發(fā)展時(shí),企業(yè)內(nèi)容管理平臺(tái)必須能夠支持這些新的技術(shù)以及新的標(biāo)準(zhǔn)。同時(shí)還要在技術(shù)、軟件、平臺(tái)本身升級(jí)時(shí)保護(hù)用戶先有的數(shù)據(jù)。 作為企業(yè)內(nèi)容管理的廠商通常需要掌握數(shù)據(jù)庫、應(yīng)用服務(wù)器、存儲(chǔ)等必需的核心技術(shù)。然后將這些技術(shù)整合在一起,以滿足用戶的需求。比如,下圖中的三角形架構(gòu)是一種代表性架構(gòu),充分利用了各種軟件技術(shù)的優(yōu)勢(shì),設(shè)計(jì)出了高效、靈活、高擴(kuò)展的企業(yè)內(nèi)容管理平臺(tái)。該體系結(jié)構(gòu)是由一個(gè)索引服務(wù)器、一個(gè)或多個(gè)資源管理器和一個(gè)或多個(gè)客戶程序構(gòu)成的三角形客戶/服務(wù)器模型。 索引服務(wù)器(又稱圖書館服務(wù)器)負(fù)責(zé)存儲(chǔ)管理用戶安全控制信息和關(guān)于數(shù)字對(duì)象的元數(shù)據(jù)信息等。底層基于關(guān)系數(shù)據(jù)庫管理存儲(chǔ)所有的元數(shù)據(jù)信息、安全權(quán)限控制信息、用戶信息,并支持參量檢索、文本檢索、參量/文本混合檢索等多渠道檢索方式。 資源管理器負(fù)責(zé)存儲(chǔ)管理數(shù)字對(duì)象,支持從硬盤到磁帶庫、光盤庫的多層級(jí)存儲(chǔ)管理,支持從一個(gè)資源管理器到多個(gè)資源管理器的擴(kuò)展。通過基于流媒體的媒體資源管理器支持對(duì)音頻、視頻信息的流媒體服務(wù)。 當(dāng)用戶想獲取某內(nèi)容對(duì)象時(shí),客戶程序發(fā)送查詢請(qǐng)求至索引服務(wù)器,然后索引服務(wù)器返回搜索結(jié)果并將內(nèi)容對(duì)象存儲(chǔ)的具體存儲(chǔ)位置加密形成安全對(duì)象令牌??蛻舳烁鶕?jù)索引服務(wù)器發(fā)來的安全令牌發(fā)出獲取內(nèi)容對(duì)象的請(qǐng)求至資源管理器,最后資源管理器響應(yīng)并解析請(qǐng)求,并將內(nèi)容對(duì)象直接返回至客戶端。這種方式可以保證“安全盡在控制,信息一站必達(dá)”。 在這個(gè)三角形架構(gòu)下,可以支持多個(gè)分布式資源管理器,具有很好的擴(kuò)展性。而客戶對(duì)系統(tǒng)的所有操作,包括增加、更新、刪除、提取等等,都通過統(tǒng)一的庫訪問協(xié)議完成,從而保證信息的一致性、完整性和安全性。 2、數(shù)據(jù)模型 數(shù)據(jù)模型的設(shè)計(jì)應(yīng)該是企業(yè)內(nèi)容管理中最有挑戰(zhàn)性的技術(shù)實(shí)現(xiàn)之一。數(shù)據(jù)模型的能力直接表現(xiàn)出一個(gè)企業(yè)內(nèi)容管理平臺(tái)適應(yīng)用戶需求的能力。在實(shí)施企業(yè)內(nèi)容管理的初始階段,我們只能了解很少的一部分需求,如果我們?cè)O(shè)計(jì)數(shù)據(jù)模型時(shí)僅基于這些特定的需求,那么這個(gè)應(yīng)用可能只能適應(yīng)客戶當(dāng)時(shí)的需求,而無法適應(yīng)客戶的需求變化。在內(nèi)容管理中,通常元數(shù)據(jù)越復(fù)雜,內(nèi)容提升價(jià)值的潛力就越大。而豐富元數(shù)據(jù)的模型不是一蹴而就的,這就要求一個(gè)面向客戶內(nèi)容管理的通用數(shù)據(jù)模型,以適應(yīng)客戶不斷變化的需求,提升信息的價(jià)值。如下圖這個(gè)抽象的內(nèi)容管理數(shù)據(jù)模型非常值得借鑒。 在這個(gè)模型中,在對(duì)一個(gè)內(nèi)容進(jìn)行描述時(shí),支持多層級(jí)的元數(shù)據(jù)模型,支持對(duì)各種復(fù)合文檔的精確描述,可以對(duì)同一文檔中不同的資源對(duì)象實(shí)施不同的處理和控制;該模型也可以靈活地描述內(nèi)容和內(nèi)容之間的關(guān)系以及內(nèi)容在使用中的工作狀態(tài)。而圖形化的建模工具以及支持建模的API可以幫助方便客戶和應(yīng)用開發(fā)商通過不同方式快速建模并進(jìn)行調(diào)整。現(xiàn)在,某些行業(yè)已經(jīng)開始定制行業(yè)元數(shù)據(jù)標(biāo)準(zhǔn)來描述復(fù)雜的需求,例如數(shù)字圖書館行業(yè)和廣電行業(yè)開始基于都柏林元數(shù)據(jù)定制自己行業(yè)的多層級(jí)元數(shù)據(jù)標(biāo)準(zhǔn),并以XML描述。XML與通常的關(guān)系型數(shù)據(jù)庫不同之處在于其數(shù)據(jù)是有結(jié)構(gòu)的,并且可能在同一個(gè)Tag下包含多值。如上圖所示的元數(shù)據(jù)模型可以方便地支持從XML文件向內(nèi)容管理數(shù)據(jù)模型的轉(zhuǎn)換。在描述不同內(nèi)容之間的關(guān)系時(shí),準(zhǔn)許用戶在初始模型建立時(shí)或者在使用過程中隨時(shí)建立鏈接(Link)、數(shù)據(jù)庫外鍵和引用屬性(引用屬性是一種可以將一個(gè)字段變成指向另一條記錄的指針)。這是一種可以將系統(tǒng)中任意兩個(gè)記錄關(guān)聯(lián)在一起的方法,不管這兩條記錄在數(shù)據(jù)模型上是否相似,也無論他們是否已經(jīng)和其他記錄建立了鏈接關(guān)系,從而為客戶建立描述內(nèi)容的組織方式提供了便利的條件。出于性能和穩(wěn)定考慮,目前基于關(guān)系型數(shù)據(jù)庫還是保存元數(shù)據(jù)最好的手段。未來的趨勢(shì)是越來越加強(qiáng)對(duì)XML的支持,包括對(duì)XML數(shù)據(jù)庫的支持。 3、檢索查詢 對(duì)于企業(yè)內(nèi)容管理的最終用戶來說,如何高效準(zhǔn)確地找到自己所需要的資源是首要課題。尤其是企業(yè)內(nèi)容管理的數(shù)據(jù)模型逐漸復(fù)雜、來源更加多樣化,使得檢索查詢就變得更加重要,同時(shí)也變得非常困難。因此企業(yè)內(nèi)容管理系統(tǒng)需要支持標(biāo)準(zhǔn),支持多渠道復(fù)合檢索以及查詢優(yōu)化。 用戶可以實(shí)現(xiàn)在對(duì)單一系統(tǒng)的查詢,也可以使用信息集成技術(shù),完成一次檢索對(duì)多個(gè)數(shù)據(jù)源的查詢。 從數(shù)據(jù)模型的分析上得出,企業(yè)內(nèi)容管理系統(tǒng)的元數(shù)據(jù)可以非常復(fù)雜。例如各種基于XML的元數(shù)據(jù)標(biāo)準(zhǔn),其定義都極其詳細(xì)。舉例來說,廣電標(biāo)準(zhǔn)數(shù)據(jù)模型規(guī)定了廣播電視音像資料編目著錄項(xiàng)目和規(guī)則,適用于廣播電視音像資料的編目著錄,將主要用于廣播電視音像資料的收藏、管理、檢索、資料獲取,具有實(shí)用、簡(jiǎn)單、靈活、易轉(zhuǎn)換、可擴(kuò)展等特性。這個(gè)數(shù)據(jù)模型,包括了4級(jí)信息,每個(gè)級(jí)別的信息包括15大屬性,屬性里面又包括多個(gè)子屬性,很多屬性則是用多值的方式實(shí)現(xiàn)的。這樣的模型創(chuàng)建后,需要一個(gè)簡(jiǎn)單、強(qiáng)大且基于標(biāo)準(zhǔn)的檢索方式,而查詢中可能會(huì)涉及到元數(shù)據(jù)參量查詢、元數(shù)據(jù)的全文檢索、文本對(duì)象的全文檢索等復(fù)合檢索等等,單純使用關(guān)系型數(shù)據(jù)庫的SQL語言很難滿足這種多渠道檢索的需求。對(duì)XML查詢的支持是業(yè)界普遍采用技術(shù)基礎(chǔ)。例如有的產(chǎn)品從XQuery和XPath上設(shè)計(jì)出了非常好的查詢方法。IBMContentManager通過查詢解析器,將用戶的查詢重新處理,并進(jìn)行優(yōu)化,然后向底層的數(shù)據(jù)庫發(fā)出查詢語句。這種被稱為XQPE(XQueryPathExpressions)的查詢語言可以完全闡釋所有可能用到的數(shù)據(jù)模型,并且使用簡(jiǎn)單,高效。 在內(nèi)容管理平臺(tái)中,除了對(duì)關(guān)系型數(shù)據(jù)庫的元數(shù)據(jù)進(jìn)行參量檢索外,對(duì)元數(shù)據(jù)以及文本對(duì)象的全文檢索也是非常重要的。所謂全文檢索(FullTextSearch),通常是指對(duì)文字型的處理對(duì)象,根據(jù)數(shù)據(jù)資料的內(nèi)容,而不是根據(jù)外在特征來實(shí)現(xiàn)的信息檢索手段。例如,IBMContentManager可以在文本正文及文本字段屬性上建立全文搜索。全文索引是對(duì)字的檢索。另外還有一個(gè)概念是智能檢索,或者稱為TokenSearch,這是基于詞的檢索,涉及到分詞、對(duì)詞的概念和意圖分析等等。 需要注意的是,全文檢索查詢,尤其是中文智能檢索只是內(nèi)容管理系統(tǒng)中的一種檢索方式?,F(xiàn)在有很多誤導(dǎo)的信息,試圖將“全文檢索”、“中文智能檢索”曲解成內(nèi)容管理。客戶實(shí)施了這種“內(nèi)容管理”系統(tǒng)后,肯定無法達(dá)到預(yù)先的期望。因?yàn)閱渭兊娜乃阉饕鏌o法完成客戶對(duì)內(nèi)容的管理需求。而且,單純的全文搜索引擎不能有效地與關(guān)系型數(shù)據(jù)庫的結(jié)構(gòu)化息集成,在整合檢索時(shí)的效率也是必須注意的問題。 4、內(nèi)容管理的API 為了更好支持在企業(yè)內(nèi)容管理平臺(tái)上快速開發(fā)出滿足用戶需求的應(yīng)用,內(nèi)容管理平臺(tái)必須提供出完整的API以滿足各種客戶端的開發(fā)。完整的API支持是區(qū)別企業(yè)內(nèi)容管理平臺(tái)和一般的內(nèi)容管理應(yīng)用重要依據(jù)。通過企業(yè)內(nèi)容管理平臺(tái)提供的API,廠商可以開發(fā)出面向各種不同客戶需求的垂直應(yīng)用,也可以支持應(yīng)用開發(fā)商和客戶開發(fā)自己的內(nèi)容管理應(yīng)用。因此,如何設(shè)計(jì)好API就成為關(guān)鍵的問題。做過軟件的朋友可能都有體會(huì),做一個(gè)應(yīng)用不難,但是做一個(gè)平臺(tái)非常難,其中的一個(gè)原因就是需要為使用者提供出完整的API。這些API既要保證體現(xiàn)平臺(tái)所有的功能,又要盡量遵循標(biāo)準(zhǔn)。只有遵循業(yè)界標(biāo)準(zhǔn),才可以保證開發(fā)人員容易上手,應(yīng)用容易移植。但是,與關(guān)系型數(shù)據(jù)庫這種成熟的平臺(tái)不同,內(nèi)容管理平臺(tái)還處在發(fā)展階段,并沒有像關(guān)系型數(shù)據(jù)庫那樣有JDBC和ODBC等成熟的標(biāo)準(zhǔn)。JSR170(ContentRepositoryAPIforJava)、XQuery(XMLQueryLanguage)和JSR225(XQueryAPIforJava)等都是企業(yè)內(nèi)容管理的候選標(biāo)準(zhǔn)。只是目前這些標(biāo)準(zhǔn)還無法完全滿足客戶需求,所以必須基于這些標(biāo)準(zhǔn)進(jìn)行擴(kuò)展。 5、工作流 在企業(yè)內(nèi)容管理軟件中,工作流是必須考慮的要素。通常實(shí)現(xiàn)工作流的方法有兩個(gè)不同層面,一個(gè)層面是使用軟件內(nèi)置的工作流,支持在單一系統(tǒng)內(nèi)部的工作流。這種工作流簡(jiǎn)單易用,使用成本低,而且效率很高。 另一層面則是基于第三方的工作流引擎,為企業(yè)搭建企業(yè)工作流程管理的總線,實(shí)現(xiàn)跨不同系統(tǒng)的企業(yè)工作流程管理。 在企業(yè)內(nèi)容管理軟件中,還有很多因素都是需要考慮并值得關(guān)注的。例如對(duì)于內(nèi)容的版權(quán)保護(hù)、數(shù)字水印;安全認(rèn)證和權(quán)限管理;捕獲和創(chuàng)建的方式;以及計(jì)算機(jī)輸出管理、電子記錄的管理(RecordManager)、流媒體服務(wù)等等。因?yàn)槠年P(guān)系,這里就不在一一詳述了。 從上面的技術(shù)淺析,我們可以看到,內(nèi)容管理已經(jīng)從當(dāng)年的“特殊應(yīng)用管理內(nèi)容”到“特定領(lǐng)域的內(nèi)容管理系統(tǒng)”發(fā)展成今天的“通用企業(yè)內(nèi)容管理平臺(tái)”了。企業(yè)和組織也迫切需要將內(nèi)部的各種內(nèi)容進(jìn)行有序管理、挖掘信息的價(jià)值,并支持前端不同的應(yīng)用。統(tǒng)一性、完整性、集成性、開放性、可擴(kuò)展性、技術(shù)成熟度以及標(biāo)準(zhǔn)支持是進(jìn)行企業(yè)內(nèi)容管理系統(tǒng)選型的重要因素,也是快速啟動(dòng)內(nèi)容管理的垂直應(yīng)用并使之不斷擴(kuò)展的基礎(chǔ)。
多層次展示 由于內(nèi)容管理解決方案種類比較繁多,我們僅從中選擇了幾款主流的軟件給用戶參考。 IBM DB2內(nèi)容管理解決方案 IBM DB2內(nèi)容管理家族是一套全面的
作為IBM企業(yè)內(nèi)容管理系列產(chǎn)品的一個(gè)關(guān)鍵組成部分,IBM DB2 Content Manager(內(nèi)容管理器,CM)是下一代企業(yè)信息集成基礎(chǔ)設(shè)施。其功能支持事務(wù)處理、安全性、流程集成和生命周期管理。內(nèi)容管理器在單一、開放式的體系架構(gòu)中處理所有類型數(shù)字化內(nèi)容的管理、共享、重用和存檔。內(nèi)容管理器支持基于HTML和XML的Web內(nèi)容、圖象、電子辦公文件、視頻和音頻等多媒體數(shù)據(jù)。為了強(qiáng)化這些功能,內(nèi)容管理器增加了DB2 Content Manager OnDemand,這是一種電子化報(bào)表管理和電子賬單解決方案,能夠大量捕獲計(jì)算機(jī)的輸出結(jié)果。 DB2 Content Manager OnDemand支持高性能的自動(dòng)化捕獲、索引、歸檔、搜索、讀取、展示和重新制作計(jì)算機(jī)生成的文檔 /報(bào)表,以及其他的企業(yè)相關(guān)文檔。通過該產(chǎn)品,用戶可以削減紙張、膠片或磁性存儲(chǔ)設(shè)備的費(fèi)用;通過按需讀取和展示來改進(jìn)信息的管理;自動(dòng)管理報(bào)表的存儲(chǔ)需求,支持硬盤、光學(xué)和磁帶存儲(chǔ)設(shè)備。 Interwoven 6 Interwoven公司日前最新發(fā)布的內(nèi)容管理平臺(tái)Interwoven 6平臺(tái)不僅應(yīng)用涵蓋廣泛,通過Interwoven的旗艦產(chǎn)品TeamSite 6.0內(nèi)容服務(wù)平臺(tái),使內(nèi)容管理能夠貫穿整個(gè)企業(yè);而且其行業(yè)解決方案致力于提供行業(yè)性的應(yīng)用,包括銷售、服務(wù)、IT和市場(chǎng)機(jī)構(gòu)等多方面商業(yè)挑戰(zhàn)的解決方案;在業(yè)務(wù)拓展領(lǐng)域,基于Interwoven 6可開發(fā)滿足企業(yè)內(nèi)容管理相關(guān)的內(nèi)部及外部應(yīng)用需求。 Interwoven 6是向所有企業(yè)現(xiàn)有的數(shù)據(jù)資源“開放”的內(nèi)容管理平臺(tái),它能夠“動(dòng)態(tài)”地同時(shí)處理編碼和內(nèi)容,“靈活”地智能濃縮來源于元數(shù)據(jù)的內(nèi)容,“迅捷”地利用其特有的專利技術(shù)和基于標(biāo)準(zhǔn)的組件。它是定位于為企業(yè)需求而設(shè)計(jì)的內(nèi)容管理平臺(tái),以TeamSite 6.0內(nèi)容服務(wù)器(TeamSite 6.0 Content Server)為基礎(chǔ)。TeamSite 6.0引進(jìn)了突破性的用戶體驗(yàn)ContentCenter,為用戶能夠迅捷簡(jiǎn)易地使用而專門設(shè)計(jì)。ContentCenter使所有的用戶能夠在內(nèi)容方面做出貢獻(xiàn)和協(xié)作,包括商業(yè)投資者、商業(yè)管理用戶和技術(shù)開發(fā)者。 Interwoven 6還能提供一個(gè)全新的用戶化架構(gòu)——ContentServices UI Toolkit,使得為ContentCenter契合的用戶化得以解決,如同定制完全客戶化的界面。 Interwoven 6提供行業(yè)內(nèi)第一個(gè)基于服務(wù)導(dǎo)向架構(gòu)(Services Oriented Architecture)的內(nèi)容管理。Interwoven ContentServices SDK 2.0使企業(yè)商務(wù)應(yīng)用軟件能夠更加迅捷、靈活地銜接。 微軟Content Management Server 微軟 Content Management Server是一種允許企業(yè)快速、高效的建立、部署并維護(hù)高度動(dòng)態(tài)化Internet、企業(yè)內(nèi)部網(wǎng)絡(luò)及企業(yè)外部網(wǎng)絡(luò)Web站點(diǎn)的企業(yè)級(jí)Web內(nèi)容管理系統(tǒng)。 該產(chǎn)品是用于管理企業(yè)級(jí)Web內(nèi)容的全面系統(tǒng),允許內(nèi)容提供者創(chuàng)建、管理并發(fā)布其自己的內(nèi)容,同時(shí)允許IT部門快速部署具備伸縮能力的動(dòng)態(tài)站點(diǎn)。 通過企業(yè)級(jí)Web站點(diǎn)針對(duì)多種訪問者、設(shè)備及目的提供動(dòng)態(tài)內(nèi)容。相關(guān)內(nèi)容的個(gè)性化特性能夠確保為潛在客戶、客戶、企業(yè)員工及商務(wù)合作伙伴提供積極的用戶體驗(yàn),幫助用戶部署企業(yè)級(jí)可伸縮性動(dòng)態(tài)電子商務(wù)Web站點(diǎn),并實(shí)現(xiàn)比其他任何Web內(nèi)容管理產(chǎn)品都要明顯加快的投資回報(bào)。 TRS內(nèi)容管理解決方案 TRS是國內(nèi)中文內(nèi)容管理的推動(dòng)者,致力于開發(fā)領(lǐng)先的內(nèi)容管理技術(shù)基礎(chǔ)設(shè)施和應(yīng)用產(chǎn)品,目標(biāo)是成為中文內(nèi)容管理領(lǐng)域技術(shù)和市場(chǎng)的領(lǐng)導(dǎo)者。 TRS內(nèi)容管理解決方案以XML和JAVA為基本標(biāo)準(zhǔn),其全能信息檢索和中文知識(shí)管理技術(shù)是TRS內(nèi)容管理產(chǎn)品的核心競(jìng)爭(zhēng)優(yōu)勢(shì),TRS能夠全面滿足內(nèi)容采集、內(nèi)容創(chuàng)建、內(nèi)容傳遞和內(nèi)容分析完整價(jià)值鏈管理的集成化產(chǎn)品。TRS 內(nèi)容管理解決方案是企業(yè)內(nèi)容管理(ECM)、網(wǎng)站內(nèi)容管理(WCM)和電子商務(wù)內(nèi)容管理的利器。TRS產(chǎn)品系列包括從數(shù)字圖書館資源整合門戶、內(nèi)容協(xié)作平臺(tái)、全能內(nèi)容檢索系統(tǒng)、網(wǎng)絡(luò)信息雷達(dá)系統(tǒng)等涵蓋企業(yè)內(nèi)容管理應(yīng)用多個(gè)層面。 其中TRS內(nèi)容檢索服務(wù)器突破了傳統(tǒng)全文檢索和網(wǎng)頁搜索引擎的種種局限,是基于知識(shí)的智能內(nèi)容檢索系統(tǒng)。TRS全能內(nèi)容檢索系統(tǒng),采用TRS具有先進(jìn)水平的信息檢索和中文自然語言處理研究成果,具有優(yōu)秀的檢索效果和查詢性能,是信息檢索的技術(shù)和市場(chǎng)領(lǐng)導(dǎo)者之一。 讓非結(jié)構(gòu)化數(shù)據(jù)“結(jié)構(gòu)化”? 潘永花 咱們且不用說企業(yè),就是個(gè)人,我們也有各種各樣的“非結(jié)構(gòu)化數(shù)據(jù)”,每個(gè)人都會(huì)擁有大量的Word、Excel、Powerpoint文檔以及各種音頻、視頻文件,還有每天都收到的大量郵件,可這些東西如果不進(jìn)行及時(shí)整理,日積月累之后,我們往往再查找其中對(duì)自己有用的信息,就要頗費(fèi)一番工夫。網(wǎng)絡(luò)的迅猛發(fā)展給這些信息的傳播制造了優(yōu)厚條件,隨著企業(yè)無紙化辦公水平的提高,它們所擁有的這種非結(jié)構(gòu)化數(shù)據(jù)更是數(shù)不勝數(shù)。記者曾經(jīng)采訪一個(gè)銀行的用戶,它們?cè)诓捎脙?nèi)容管理軟件之前每年花費(fèi)在紙張上的費(fèi)用高達(dá)1500萬,而在實(shí)現(xiàn)公文流轉(zhuǎn)通過網(wǎng)絡(luò)進(jìn)行,通過內(nèi)容管理軟件對(duì)之進(jìn)行有效管理之后,1500萬的花費(fèi)就可以完全節(jié)省下來。 雖然我們談了很多內(nèi)容管理軟件帶來的好處,但企業(yè)級(jí)內(nèi)容管理技術(shù)目前還不是很成熟。我們知道用來管理結(jié)構(gòu)化數(shù)據(jù)的關(guān)系數(shù)據(jù)庫從理論到技術(shù)上經(jīng)歷了數(shù)年發(fā)展,已經(jīng)相當(dāng)成熟,而非結(jié)構(gòu)化數(shù)據(jù)的復(fù)雜程度遠(yuǎn)遠(yuǎn)高于結(jié)構(gòu)化數(shù)據(jù),所以內(nèi)容管理技術(shù)還存在很多有待解決的難題,比如,如何很好地解決多種異構(gòu)數(shù)據(jù)源的存儲(chǔ)和查詢就是其中的關(guān)鍵問題。雖然有人認(rèn)為將來XML數(shù)據(jù)庫將能比較好地解決非結(jié)構(gòu)化數(shù)據(jù)的管理問題,但將現(xiàn)有文檔映射到XML文檔的工作才剛剛開始,XML查詢語言也遠(yuǎn)不如SQL成熟,我們?cè)?jīng)目睹的面向?qū)ο髷?shù)據(jù)庫的失敗更給XML數(shù)據(jù)庫敲響了警鐘。將XML以及其他內(nèi)容管理技術(shù)與關(guān)系數(shù)據(jù)庫的結(jié)合可能將會(huì)是一條主流道路。同時(shí),內(nèi)容管理軟件應(yīng)用層面往往不會(huì)孤軍奮戰(zhàn),它還需要與企業(yè)門戶、協(xié)作軟件、企業(yè)應(yīng)用集成這些技術(shù)緊密結(jié)合在一起。將非結(jié)構(gòu)化的數(shù)據(jù)實(shí)現(xiàn)“結(jié)構(gòu)化”管理正在走進(jìn)我們,但要想成為如同關(guān)系數(shù)據(jù)庫一樣成為主流,還是一條漫漫長(zhǎng)路。
(網(wǎng)頁編輯:小關(guān)) |
|