1 引言 知識圖譜是一個包含很多技術(shù)內(nèi)容的知識體系,總的來說,是處理關(guān)聯(lián)的知識,核心是數(shù)據(jù),但強(qiáng)調(diào)了數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。簡單來看,可以認(rèn)為是數(shù)據(jù)庫或知識庫,和語義網(wǎng)有著千絲萬縷的聯(lián)系。知識圖譜是由谷歌首先提出來的,用于優(yōu)化它的搜索能力,之后,獲得了蓬勃的發(fā)展,研究的人也越來越多。 知識圖譜的出現(xiàn),不是一蹴而就的,有一個緩慢演進(jìn)的過程,包括現(xiàn)在,也還在發(fā)展中。知識圖譜的發(fā)展,可以從多個方面進(jìn)行闡述,比如開放鏈接數(shù)據(jù)的思想,知識表示,知識推理,知識存儲等,伴隨著信息技術(shù)特別是人工智能技術(shù)的發(fā)展,知識圖譜不斷融合新的技術(shù),不斷發(fā)展和完善。此處主要講述知識圖譜理論的形成過程。 2 信息機(jī)器Memex 1945年,一個美國科學(xué)家Vannevar Bush在《大西洋月刊》上發(fā)表了一篇文章《As We May Think》,提出一種信息機(jī)器的構(gòu)想,就像下圖中的樣子。 在Bush博士的設(shè)想中,這種機(jī)器還可以與圖書館聯(lián)網(wǎng)。通過某種機(jī)制,將圖書館收藏的膠卷,自動裝載到本地機(jī)器上。因此,只通過這一個機(jī)器,就可以實(shí)現(xiàn)海量的信息檢索。他將這種機(jī)器命名為Memex,也就是“memory extender”這兩個單詞詞首的組合,意思是“記憶的延伸”。 文中描述了對這種機(jī)器的設(shè)想,“Wholly new forms of encyclopedias will appear, ready-made with a mesh of associative trails running through them, ready to be dropped into the memex and there amplified.” 這個設(shè)想的影響非常大,后來許多早期的計(jì)算機(jī)論文中都提到了這個機(jī)器。然后,文中關(guān)于信息切換的描述,直接啟發(fā)了“超文本協(xié)議”(hypertext)的發(fā)明?,F(xiàn)在,我們在互聯(lián)網(wǎng)上不同的鏈接之間跳轉(zhuǎn),其源頭都可以追溯到這篇文章。 3 以超鏈接為主的WEB 1989年3 月,蒂姆·伯納·李爵士(Tim Berners-Lee)向CERN遞交了一份立項(xiàng)建議書,建議采用超文本技術(shù)(Hypertext)把CERN內(nèi)部的各個實(shí)驗(yàn)室連接起來,在系統(tǒng)建成后,將可能擴(kuò)展到全世界。 在建議書中,有一段話以超文本為核心的web,比利用層級結(jié)構(gòu)的方式,更容易讓熱接受和傳播。 This is why a 'web' of notes with links (like references) between them is far more useful than a fixed hierarchical system. When describing a complex system, many people resort to diagrams with circles and arrows. Circles and arrows leave one free to describe the interrelationships between things in a way that tables, for example, do not. The system we need is like a diagram of circles and arrows, where circles and arrows can stand for anything. 文中說明了超文本利用圓圈和箭頭可以自由的描述任何事物,比使用層級結(jié)構(gòu)的表格要靈活的多,特別是描述復(fù)雜系統(tǒng),作用更加突出,這就是超文本的作用。這個思想也是現(xiàn)在比較流行的思維導(dǎo)圖的核心思想,利用發(fā)散思維,建立聯(lián)系。 4 以鏈接數(shù)據(jù)為核心的語義網(wǎng) 語義網(wǎng)的概念也是由萬維網(wǎng)聯(lián)盟的蒂姆在1998年提出,它的核心是通過給萬維網(wǎng)上的文檔 (如:HTML文檔、XML文檔)添加能夠被計(jì)算機(jī)所理解的語義“元數(shù)據(jù)”(外語:Meta data),從而使整個互聯(lián)網(wǎng)成為一個通用的信息交換媒介。 語義網(wǎng)不同于現(xiàn)在WWW,現(xiàn)有的WWW是面向文檔而語義網(wǎng)則面向文檔所表示的數(shù)據(jù),而語義網(wǎng)更重視于計(jì)算機(jī)“理解與處理”,并且具有一定的判斷、推理能力。 2006年蒂姆·伯納斯-李在普林斯頓大學(xué)演講和后期接受媒體采訪時公開表示,他最初將這種智能網(wǎng)絡(luò)命名為語義網(wǎng)或許不夠貼切,也許更準(zhǔn)確的名稱應(yīng)該是數(shù)據(jù)網(wǎng)(外語:Data Web)。 5 谷歌知識圖譜,things, not strings 鏈接數(shù)據(jù)不斷積累,數(shù)據(jù)量以幾何量級增長,如何更好的使用這些數(shù)據(jù),搜索引擎公司Google提出了知識圖譜的概念。辛格博士曾經(jīng)說過,The world is not made of strings , but is made of things. 知識圖譜的提出,目的在于更好的利用開放鏈接數(shù)據(jù),將搜索字符串變?yōu)樗阉髡鎸?shí)世界中的事物,將一個事物通過內(nèi)部特征(屬性)和外部聯(lián)系(關(guān)系),立體的呈現(xiàn)在人們面前,將知識圖譜看作一張以關(guān)聯(lián)關(guān)系為主的巨大圖譜,圖譜中,點(diǎn)代表客觀事物,邊代表了事物的屬性或關(guān)系。 6 結(jié)語 在知識圖譜的演進(jìn)過程中,還有很多思想和技術(shù)起到了非常大的作用,比如本體論,本來是哲學(xué)中的概念,被引入到知識圖譜中,用來指導(dǎo)知識表示,使得知識圖譜的知識表示更加規(guī)范,能夠?yàn)橛?jì)算機(jī)所理解,在知識圖譜發(fā)展中起到了不可或缺的作用。 原文:https://www.cnblogs.com/coodream2009/p/11145096.html |
|