![]() 一、知識(shí)圖譜是什么?如字面意思,知識(shí)圖譜可以拆解為“知識(shí)”和“圖譜”去理解。 知識(shí),是人們?cè)诟脑焓澜绲膶?shí)踐中所獲得的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。 圖譜,是一種強(qiáng)調(diào)鏈接的存儲(chǔ)方式。 知識(shí)圖譜其實(shí)就是存儲(chǔ)及表達(dá)知識(shí)的一種方式。 但一個(gè)知識(shí)的儲(chǔ)存方式為什么會(huì)被單獨(dú)提出來(lái)?甚至被Google作為一項(xiàng)技術(shù)項(xiàng)目單獨(dú)提出來(lái)? 首先得了解知識(shí)在認(rèn)知中起到的作用。 其實(shí)在Google之前,知識(shí)圖譜的前身:語(yǔ)義網(wǎng)絡(luò)早在1960年代就被提出,當(dāng)時(shí)是作為知識(shí)表示的一種方法被提出,主要應(yīng)用于自然語(yǔ)言理解領(lǐng)域(讓機(jī)器能夠理解語(yǔ)言)。 ![]() 知識(shí)圖譜演化的重要節(jié)點(diǎn) 正如人去理解一段話所表達(dá)的意思時(shí),也用到了知識(shí),比如“阿偉手上拿著剛發(fā)布的蘋果”,這句話要能被正確理解,離不開對(duì)應(yīng)的知識(shí),至少得知道蘋果除了是吃的,還可以是個(gè)手機(jī)牌子。 也就是說(shuō)知識(shí)圖譜起源是為了讓機(jī)器更好的理解語(yǔ)言,通過(guò)建立起知識(shí)庫(kù),這種方法企圖讓機(jī)器擁有更多的“知識(shí)點(diǎn)”,能進(jìn)行更多的聯(lián)想及推理,對(duì)信息的理解更到位。 ![]() 知識(shí)圖譜在人工智能中充當(dāng)“記憶”的角色 知識(shí)的作用不僅限于文本,對(duì)圖片也一樣。 解讀出的感受是又油又土十分好笑,這其中也運(yùn)用了知識(shí)聯(lián)想,聯(lián)想了演員在社交媒體中的人設(shè)形象,當(dāng)前的表情及動(dòng)作,聯(lián)想了發(fā)圖者與自己的關(guān)系,于是會(huì)心一笑。 二、為什么是圖譜?為什么演化到目前階段,是通過(guò)圖譜去存儲(chǔ)知識(shí),而不是傳統(tǒng)數(shù)據(jù)庫(kù)? 我認(rèn)為有兩點(diǎn): 第一是因?yàn)閳D譜的存儲(chǔ)結(jié)構(gòu)足夠簡(jiǎn)單,圖譜通過(guò)“三元組”存儲(chǔ)知識(shí),即頭實(shí)體、關(guān)系,尾實(shí)體組成; 比如:蘋果手機(jī)是蘋果公司旗下的產(chǎn)品,抽象成知識(shí)表達(dá)的三元組即是: ![]() 幾乎所有的能通過(guò)符號(hào)表示的知識(shí)都能用這個(gè)結(jié)構(gòu)進(jìn)行儲(chǔ)存。 第二是因?yàn)榛ヂ?lián)思維的普及,在強(qiáng)調(diào)萬(wàn)物互聯(lián)的時(shí)代,圖譜這種注重鏈接的存儲(chǔ)方式能串聯(lián)不同領(lǐng)域的知識(shí),從而挖掘其中關(guān)系隱藏的價(jià)值。 三、知識(shí)圖譜有什么用?目前知識(shí)圖譜應(yīng)用主要有兩個(gè)大方向: 1. 輔助語(yǔ)言理解知識(shí)圖譜在輔助語(yǔ)言理解方面起的作用有: 實(shí)體消歧:對(duì)文中提到的多義詞進(jìn)行精準(zhǔn)判斷,如上文提到的蘋果案例。 指代消解:對(duì)文中的代詞做出解釋,如他和它。 其中代表性的應(yīng)用如下: (1)搜索 傳統(tǒng)搜索只提供對(duì)網(wǎng)頁(yè)的搜索(紅框部分),圖譜提供了對(duì)事物本身的描述,讓結(jié)果更直觀,更符合查詢的語(yǔ)義。 ![]() 圖譜搜索效果展示 (2)問(wèn)答 垂直領(lǐng)域的問(wèn)答系統(tǒng)會(huì)涉及到許多專業(yè)知識(shí)面的問(wèn)題,舉個(gè)保險(xiǎn)行業(yè)的例子: 比如當(dāng)客戶問(wèn)到:“xx保險(xiǎn)能不能保障脊髓灰質(zhì)炎?” 知識(shí)圖譜可以通過(guò)結(jié)合保險(xiǎn)領(lǐng)域知識(shí)與醫(yī)療知識(shí)進(jìn)行推理,從而給出精準(zhǔn)答案。 ![]() 知識(shí)推理簡(jiǎn)化示意圖 2. 輔助大數(shù)據(jù)分析圖譜可以結(jié)合各類領(lǐng)域的知識(shí),打造領(lǐng)域型的知識(shí)圖譜,目前在大數(shù)據(jù)分析方面,工業(yè)落地主要應(yīng)用如下: (1)推薦 知識(shí)圖譜中包含了豐富的關(guān)聯(lián)性,可以為推薦系統(tǒng)提供部分信息來(lái)源;比如常見的推薦有電影推薦、音樂(lè)推薦。 加入圖譜推薦的好處主要是可解釋性強(qiáng),能基于設(shè)定好的推薦路徑進(jìn)行精準(zhǔn)推送。 比如小丁喜歡聽《艾米莉》,《艾米莉》的樂(lè)隊(duì)是回春丹,那么同個(gè)樂(lè)隊(duì)的歌可以作為推薦。 ![]() (2)風(fēng)控 圖結(jié)構(gòu)能非常好的與SNA(社交網(wǎng)絡(luò)分析)理論相結(jié)合,對(duì)團(tuán)伙欺詐這類型的風(fēng)險(xiǎn)能起到非常好的挖掘作用;如洗錢行為可以綜合多筆交易、企業(yè)信息等看是否出現(xiàn)資金匯集等。 圖的優(yōu)勢(shì)在于能跨多度計(jì)算,能挖出埋藏較深度的風(fēng)險(xiǎn)關(guān)系,比起傳統(tǒng)的偵察手段對(duì)團(tuán)伙作案的風(fēng)險(xiǎn)能摸查得更全面。 三、無(wú)圖譜,不AI?這句話在現(xiàn)階段,大家當(dāng)pr稿理解就好了,事實(shí)上很多的AI落地應(yīng)用,并沒(méi)有用到知識(shí)圖譜,知識(shí)圖譜本身也存在著相當(dāng)多的局限。 1. 工業(yè)落地視角至少在目前階段,許多項(xiàng)目中知識(shí)圖譜的平替方案有很多,比如風(fēng)控場(chǎng)景,通過(guò)傳統(tǒng)的數(shù)據(jù)分析也能抓出許多問(wèn)題案件;問(wèn)答場(chǎng)景,搭建簡(jiǎn)單的問(wèn)答知識(shí)庫(kù)比直接建立知識(shí)圖譜效率更高,投入更小。 究其原因還是在于這項(xiàng)技術(shù)需要非常大的資源投入,需要大量的具有豐富業(yè)務(wù)知識(shí)的專家,圖算法專家等。 實(shí)際的工業(yè)落地項(xiàng)目中,幾乎有70%的時(shí)間投入在圖譜數(shù)據(jù)的獲取、清洗、結(jié)構(gòu)化上,而像知識(shí)框架的建設(shè)、圖應(yīng)用只占了不到30%的時(shí)間。 2. 技術(shù)視角上文提到,知識(shí)圖譜的三元組形式能表示幾乎所有的符號(hào)型知識(shí),即能被很好表達(dá)的顯性知識(shí),但現(xiàn)實(shí)中存在著很多知識(shí)是隱性的,比如一項(xiàng)技能,彈鋼琴光知道樂(lè)理但沒(méi)有熟練的指法也不行。 且知識(shí)圖譜對(duì)于數(shù)據(jù)的結(jié)構(gòu)化程度要求十分之高,但現(xiàn)實(shí)中大部分業(yè)務(wù)數(shù)據(jù)是非結(jié)構(gòu)化的,如何將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為結(jié)構(gòu)化,而這是一道還沒(méi)有被解決的業(yè)界難題,是NLP的瓶頸。 四、結(jié)語(yǔ)對(duì)每項(xiàng)新技術(shù),我們應(yīng)看到技術(shù)未來(lái)的發(fā)展空間,同時(shí)也要看到技術(shù)在當(dāng)下的局限性。 保持對(duì)技術(shù)的理解、思考與反思,才能將技術(shù)真正落地。 本文由 @產(chǎn)品哲思 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。 題圖來(lái)自Unsplash,基于 CC0 協(xié)議 |
|
來(lái)自: 趨明 > 《a手機(jī)上的收藏》