乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      非結(jié)構(gòu)化數(shù)據(jù)庫(kù)及其應(yīng)用分析

       sonjay 2010-09-19
      何淑娟
      【關(guān)鍵詞】非結(jié)構(gòu)化;數(shù)據(jù)庫(kù);多類型文檔
       
      1 非結(jié)構(gòu)化數(shù)據(jù)庫(kù)的基本概念
      所謂非結(jié)構(gòu)化數(shù)據(jù)庫(kù),是指其字段長(zhǎng)度可變,并且每個(gè)字段的記錄又可以由可重復(fù)或不可重復(fù)的子字段構(gòu)成的數(shù)據(jù)庫(kù)。它從數(shù)據(jù)模型入手,采用子字段、多值字段以及變長(zhǎng)字段的機(jī)制,允許創(chuàng)建許多不同類型的非結(jié)構(gòu)化或任意格式的字段,從而突破了關(guān)系數(shù)據(jù)庫(kù)嚴(yán)格的表結(jié)構(gòu),解決了關(guān)系數(shù)據(jù)庫(kù)模型過于簡(jiǎn)單、不便表達(dá)復(fù)雜嵌套的問題;在其底層存儲(chǔ)機(jī)制的變革基礎(chǔ)上,采用先進(jìn)的倒排檔索引技術(shù),從而實(shí)現(xiàn)了對(duì)于海量文獻(xiàn)信息的快速全文檢索的功能,并同時(shí)支持多種字段限定檢索。對(duì)于多媒體信息的存儲(chǔ)和管理,非結(jié)構(gòu)化數(shù)據(jù)庫(kù)系統(tǒng)采用外部文件方式,擯棄了傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)采用二進(jìn)制字段存儲(chǔ)的方式,實(shí)現(xiàn)了對(duì)于圖形、聲音等多媒體信息的高效管理[1]。 其高效性具體表現(xiàn)在:
      (1)在數(shù)據(jù)庫(kù)結(jié)構(gòu)定義上 非結(jié)構(gòu)化數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn)了對(duì)于變長(zhǎng)字段、重復(fù)字段和子字段的定義、存儲(chǔ)和管理,并且記錄的數(shù)目、長(zhǎng)度,字段數(shù)目與長(zhǎng)度以及字段可重復(fù)次數(shù)均可不受限制,允許數(shù)據(jù)項(xiàng)具有多值性和可包含子字段,充分滿足了圖書館建立文獻(xiàn)數(shù)據(jù)庫(kù)的特殊管理要求。
      (2)在數(shù)據(jù)著錄格式方面 非結(jié)構(gòu)化數(shù)據(jù)庫(kù)不僅支持國(guó)際標(biāo)準(zhǔn)(ISO-2709,MARC,CCF)和國(guó)內(nèi)標(biāo)準(zhǔn)(CCFC)格式,而且支持最新的SGML和XML格式,具有可擴(kuò)展性,可以與其他元數(shù)據(jù)單元(項(xiàng)目)連接使用。在數(shù)據(jù)處理對(duì)象上,非結(jié)構(gòu)化數(shù)據(jù)庫(kù)采用面向?qū)ο蠹夹g(shù),不僅可以處理TXT文本、DOC、EXCEL、PPT、PDF、S2、PS2等流行的文件類型數(shù)據(jù),而且可對(duì)圖象、音頻、視頻、計(jì)算機(jī)程序以及網(wǎng)址資源進(jìn)行編目和數(shù)字化處理,覆蓋了多類型文檔應(yīng)用領(lǐng)域內(nèi)幾乎所有的文獻(xiàn)數(shù)據(jù)類型。同時(shí),非結(jié)構(gòu)化數(shù)據(jù)庫(kù)支持外掛文件的全文檢索,其獨(dú)特的外部文件支持能力使圖書館能輕松實(shí)現(xiàn)二次文獻(xiàn)掛接全文的功能。
      (3)在信息檢索查詢方面 非結(jié)構(gòu)化數(shù)據(jù)庫(kù)內(nèi)嵌全文檢索引擎,采用倒排檔索引技術(shù),不僅能夠?qū)φ麄€(gè)字段進(jìn)行查詢,而且可以提供子字段、關(guān)鍵詞、自由詞、標(biāo)引詞、位置詞和全文任意詞的單項(xiàng)及組配檢索。而且速度也非???,一般不受文獻(xiàn)量(上千萬(wàn)條記錄)的影響,滿足海量數(shù)據(jù)檢索的需要。
      (5)非結(jié)構(gòu)化數(shù)據(jù)庫(kù)提供了后控制詞表檢索系統(tǒng)。后控制詞表系統(tǒng)是提高自然語(yǔ)言全文檢索效率,減輕用戶負(fù)擔(dān)的有效途徑。該系統(tǒng)對(duì)于后控制詞表采取數(shù)據(jù)庫(kù)管理方式,與全文檢索的檢索式構(gòu)造相連接。對(duì)每一個(gè)檢索詞提供用(UF)、代(USE)、屬(BT)、分(NT)、參(RT)等關(guān)系詞,用戶可根據(jù)具體檢索需求選取關(guān)系詞,并將之增加到檢索表達(dá)式中,從而實(shí)現(xiàn)檢索表達(dá)式的優(yōu)化,提高全文檢索的效率,降低用戶負(fù)擔(dān) [2]。
      非結(jié)構(gòu)化數(shù)據(jù)庫(kù)的應(yīng)用
        關(guān)系數(shù)據(jù)庫(kù)從設(shè)計(jì)之初并沒有也不可能考慮到以HTTP為基礎(chǔ)、HTML為文件格式的因特網(wǎng)的需求,只是在因特網(wǎng)出現(xiàn)后才作出相應(yīng)的調(diào)整,因此關(guān)系數(shù)據(jù)庫(kù)在基于網(wǎng)絡(luò)應(yīng)用時(shí)由于結(jié)構(gòu)模型等原因的限制,不能與網(wǎng)絡(luò)完全融合,需在網(wǎng)絡(luò)與數(shù)據(jù)庫(kù)之間加入大量的中間件,從而在無形中加大了數(shù)據(jù)庫(kù)基于網(wǎng)絡(luò)應(yīng)用的難度。并且對(duì)于網(wǎng)絡(luò)環(huán)境下網(wǎng)絡(luò)應(yīng)用,如各種非結(jié)構(gòu)化文檔信息、多媒體信息以及全文檢索需求顯得力不從心。雖然后來關(guān)系數(shù)據(jù)庫(kù)對(duì)于這些需求作出了一些適應(yīng)性調(diào)整,但對(duì)于網(wǎng)絡(luò)環(huán)境下網(wǎng)絡(luò)應(yīng)用不可或缺的檢索效率、全文檢索能力等卻無法解決[3] [4]。同時(shí),關(guān)系數(shù)據(jù)庫(kù)的基于中間件的解決方案又給網(wǎng)絡(luò)應(yīng)用帶來了新的網(wǎng)絡(luò)瓶頸,應(yīng)用服務(wù)器端由于與數(shù)據(jù)庫(kù)頻繁交互,因其本身的效率和數(shù)據(jù)庫(kù)檢索的效率造成網(wǎng)絡(luò)應(yīng)用在應(yīng)用服務(wù)器端的阻塞。
      (1)文檔型和多媒體數(shù)據(jù)類型的支持問題
      在網(wǎng)絡(luò)應(yīng)用中,存在大量的復(fù)雜數(shù)據(jù)類型,如各種超文本文檔信息,各種圖片、聲音等多媒體信息資源,如何對(duì)這些信息資源進(jìn)行有效的存儲(chǔ)、管理、檢索,是網(wǎng)絡(luò)數(shù)據(jù)庫(kù)必須解決的問題,iBASE非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)通過其外部文件數(shù)據(jù)類型,可以管理各種文檔信息、多媒體信息,并且,對(duì)于各種具有檢索意義的文檔信息資源,如HTML、DOC、RTF、TXT等還提供了強(qiáng)大的全文檢索能力。
      (2)數(shù)據(jù)庫(kù)的全文檢索問題
      在網(wǎng)絡(luò)應(yīng)用中,如何從浩瀚的信息海洋中查找到所需的信息,如何保證所查詢信息的全面性和準(zhǔn)確性,也是一個(gè)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)應(yīng)用必須解決的問題。非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)通過其獨(dú)特的索引技術(shù)和基于布爾檢索表達(dá)式的查詢檢索算法,解決了基于字段級(jí)和數(shù)據(jù)庫(kù)級(jí)的全文檢索問題,用戶可以針對(duì)數(shù)據(jù)庫(kù)中特定的字段也可針對(duì)整個(gè)數(shù)據(jù)庫(kù)進(jìn)行全文檢索,從而從數(shù)據(jù)庫(kù)中檢索出感興趣的內(nèi)容 [5]。
      (3)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)應(yīng)用中的查詢和檢索效率問題
      作為網(wǎng)絡(luò)應(yīng)用,由于需要面對(duì)大量的用戶群和大量的瞬時(shí)并發(fā)數(shù)據(jù)庫(kù)查詢檢索,其數(shù)據(jù)庫(kù)查詢和檢索效率就是一個(gè)極其關(guān)鍵的問題。iBASE非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)主要通過重復(fù)字段和子字段來保證數(shù)據(jù)庫(kù)查詢和檢索的效率,實(shí)現(xiàn)了數(shù)據(jù)庫(kù)的一條記錄中一維表和二維表嵌套,從而避免了關(guān)系數(shù)據(jù)庫(kù)在大數(shù)據(jù)量時(shí)由于表連接查詢而導(dǎo)致的查詢檢索性能的急劇降低。
      (4)對(duì)現(xiàn)有網(wǎng)絡(luò)應(yīng)用的全文檢索支持問題
      非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)不僅能夠支持iBASE非結(jié)構(gòu)化數(shù)據(jù)庫(kù)的直接上網(wǎng)發(fā)布和全文檢索,對(duì)于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù),如Oracle、SYBASE、SQL Server、DB2、Informix等,也提供了導(dǎo)入和鏈結(jié)的支持能力,用戶可以采用導(dǎo)入方式,將傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)轉(zhuǎn)換為非結(jié)構(gòu)化數(shù)據(jù)庫(kù),再進(jìn)行網(wǎng)上發(fā)布和開發(fā)全文檢索應(yīng)用;用戶也可采用鏈結(jié)方式,對(duì)傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)構(gòu)建本地化索引,從而通過本地化索引實(shí)現(xiàn)對(duì)關(guān)系數(shù)據(jù)庫(kù)的全文檢索支持,iBASE非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)充當(dāng)關(guān)系數(shù)據(jù)庫(kù)應(yīng)用服務(wù)器,系統(tǒng)的檢索效率也將受關(guān)系數(shù)據(jù)庫(kù)自身檢索效率和應(yīng)用服務(wù)器交互效率的影響[6]
      3 非結(jié)構(gòu)化數(shù)據(jù)庫(kù)應(yīng)用分析
      網(wǎng)絡(luò)數(shù)據(jù)庫(kù)建設(shè)到底采用何種數(shù)據(jù)庫(kù),擺在用戶面前的至少有三種方案:關(guān)系數(shù)據(jù)庫(kù)建設(shè)方案、非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)建設(shè)方案、關(guān)系數(shù)據(jù)庫(kù)和非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)共存方案[7]
      在事務(wù)處理和數(shù)值計(jì)算方面,由于關(guān)系數(shù)據(jù)庫(kù)經(jīng)過了多年的發(fā)展,其在事務(wù)處理、數(shù)值計(jì)算方面具有強(qiáng)大的能力并已被證實(shí)。但對(duì)于超文本、文檔信息管理和數(shù)據(jù)庫(kù)全文檢索方面,關(guān)系數(shù)據(jù)庫(kù)通過其MEMO或TEXT字段等也能實(shí)現(xiàn)這種信息的存儲(chǔ),而對(duì)于這些信息或數(shù)據(jù)庫(kù)的全文檢索,關(guān)系數(shù)據(jù)庫(kù)則顯得捉襟見肘[8]
      非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)則完全解決了網(wǎng)上數(shù)據(jù)庫(kù)的全文檢索問題,通過其獨(dú)特的單漢字、單英文詞、英文字母的索引方式及樹索引算法,能夠高效地解決數(shù)據(jù)庫(kù)的網(wǎng)上全文檢索問題,構(gòu)造出強(qiáng)大的網(wǎng)上全文搜索引擎。因此,在對(duì)于超文本、文檔信息管理和數(shù)據(jù)庫(kù)全文檢索方面,非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)建設(shè)方案應(yīng)為首選。
      然而,網(wǎng)絡(luò)數(shù)據(jù)庫(kù)建設(shè)并不能從嚴(yán)格意義上按以上兩種情況進(jìn)行區(qū)分,但有一點(diǎn)可以肯定的是,大多數(shù)網(wǎng)絡(luò)應(yīng)用都會(huì)有全文檢索或構(gòu)建搜索引擎的需求,從理論上講,除事務(wù)處理能力外,非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)能夠處理所有關(guān)系數(shù)據(jù)庫(kù)支持的網(wǎng)絡(luò)應(yīng)用方式,并能對(duì)數(shù)據(jù)庫(kù)進(jìn)行全文檢索擴(kuò)展,也就是說,完全可以利用非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)構(gòu)建獨(dú)立的網(wǎng)絡(luò)應(yīng)用。
      對(duì)于一些特殊的網(wǎng)絡(luò)應(yīng)用,我們也可以采用關(guān)系數(shù)據(jù)庫(kù)和非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)兩者共存的建設(shè)方案,實(shí)現(xiàn)兩者的無縫集成,以發(fā)揮兩者各自的長(zhǎng)處。
       
      主要參考文獻(xiàn):
      [6] 趙淑梅,牛宏霞.新型的數(shù)據(jù)庫(kù)技術(shù)——XML數(shù)據(jù)庫(kù)系統(tǒng)綜述.鄭州鐵路職業(yè)技術(shù)學(xué)院學(xué)報(bào),2004,
      [7] 陸曄,吉增瑞.數(shù)據(jù)庫(kù)系統(tǒng)安全技術(shù)綜述高性能.計(jì)算技術(shù),2001,

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多