乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      TKDE2020 | 基于知識(shí)圖譜的推薦系統(tǒng)綜述

       520jefferson 2021-02-18


      TKDE 2020

      綜述:基于知識(shí)圖譜的推薦系統(tǒng)

      A Survey on Knowledge Graph-Based Recommender Systems

      中科院計(jì)算所、百度、港科大、中科大、微軟
      Qingyu Guo, Fuzhen Zhuang, Chuan Qin, Hengshu Zhu, Xing Xie, Hui Xiong, Qing He

      本文是中科院計(jì)算所、百度、港科大、中科大、微軟學(xué)者發(fā)表于TKDE-2020的工作[1]。這篇工作基于該團(tuán)隊(duì)發(fā)表于《中國(guó)科學(xué):信息科學(xué)》的中文綜述論文[2],進(jìn)一步全面地歸納了近年來(lái)基于知識(shí)圖譜的推薦系統(tǒng)方面的相關(guān)工作,對(duì)里面的核心關(guān)鍵算法進(jìn)行了展開(kāi)的介紹和對(duì)比分析,匯總了所涉及到的知識(shí)圖譜數(shù)據(jù);我們還總結(jié)了現(xiàn)有不同基于知識(shí)圖譜的推薦系統(tǒng)應(yīng)用場(chǎng)景和相應(yīng)可選擇的benchmark數(shù)據(jù)集;最后我們對(duì)該領(lǐng)域的未來(lái)發(fā)展進(jìn)行了一定的展望討論,對(duì)該領(lǐng)域今后的研究具備一定的指導(dǎo)意義。


      1. 引言 

      隨著互聯(lián)網(wǎng)的快速發(fā)展,我們正處在信息爆炸的時(shí)代。當(dāng)我們?cè)谙硎芑ヂ?lián)網(wǎng)帶來(lái)的便利的同時(shí),也面臨著信息過(guò)載的問(wèn)題,難以迅速地從海量數(shù)據(jù)中汲取所需信息。為了解決這一問(wèn)題,推薦系統(tǒng)應(yīng)運(yùn)而生,并在包括音樂(lè)、電影、購(gòu)物等眾多場(chǎng)景落地實(shí)踐,提高了用戶的體驗(yàn)。

      近段時(shí)間,基于知識(shí)圖譜的推薦系統(tǒng)引起了研究者的廣泛關(guān)注,其基本思想是將知識(shí)圖譜作為一種輔助信息引入到推薦系統(tǒng)中。這種方法既可以提高推薦系統(tǒng)的準(zhǔn)確性,又能夠?yàn)橥扑]結(jié)果提供解釋。一方面,知識(shí)圖譜是一種有向信息異構(gòu)網(wǎng)絡(luò),其中節(jié)點(diǎn)代表實(shí)體,有向邊可表示實(shí)體間的關(guān)系。知識(shí)圖譜蘊(yùn)含了推薦系統(tǒng)中物品的大量背景信息,可表示物品間的多種關(guān)系。與此同時(shí),還可以結(jié)合推薦系統(tǒng)中用戶與物品的交互數(shù)據(jù),擴(kuò)展用戶和物品間的隱藏連通關(guān)系,從而更精準(zhǔn)地建模用戶偏好,提高推薦效果。下圖是一個(gè)基于知識(shí)圖譜的推薦實(shí)例,其中既包括了用戶、電影、演員、導(dǎo)演、題材這幾種實(shí)體,又包含了實(shí)體間的復(fù)雜關(guān)系。電影“阿凡達(dá)”、“血鉆”和用戶Bob借助知識(shí)圖譜中的隱藏關(guān)系連接在一起,從而輔助系統(tǒng)做出精準(zhǔn)的推薦。另一方面,知識(shí)圖譜也使得推薦結(jié)果有跡可循。例如通過(guò)該圖中的關(guān)系序列,我們可以得知向Bob推薦“阿凡達(dá)”的一個(gè)原因是,“阿凡達(dá)”與Bob曾經(jīng)看過(guò)的星際穿越同屬科幻片。

        圖1 一個(gè)基于知識(shí)圖譜的推薦實(shí)例  

      本綜述的目的是總結(jié)與闡述利用知識(shí)圖譜做推薦的研究現(xiàn)狀,這一工作與前人的工作有所重疊,例如基于圖的推薦系統(tǒng)綜述、關(guān)于知識(shí)圖譜應(yīng)用的綜述。和前人的工作相比,我們對(duì)于方法的介紹更為深入,并提供了更細(xì)致的層次化技術(shù)分類。我們首先將該領(lǐng)域的文章分為三大類,分別是基于嵌入的方法(embedding-based methods),基于連接的方法(connection-based methods),和基于傳播的方法(propagation-based methods)。同時(shí)又按照每一類方法的特點(diǎn),提供更細(xì)致的劃分。本文的第二點(diǎn)貢獻(xiàn)是我們?cè)敿?xì)闡述了知識(shí)圖譜如何給推薦結(jié)果提供可解釋性,并總結(jié)了不同技術(shù)手段。同時(shí),我們以推薦系統(tǒng)的應(yīng)用場(chǎng)景作為劃分依據(jù),總結(jié)了不同應(yīng)用下可使用的數(shù)據(jù)集。最后,我們根據(jù)對(duì)這一領(lǐng)域的理解,提出了一些未來(lái)發(fā)展方向的展望。

      2. 方法總結(jié) 

      我們按照知識(shí)圖譜的利用方式將現(xiàn)有工作分為三大類:基于嵌入的方法,基于連接的方法和基于傳播的方法。對(duì)于每類方法,我們又做了更進(jìn)一步的劃分,并列舉了代表性工作加以介紹。我們將所調(diào)研的文章匯總在如下的表格中,將每種方法按照我們總結(jié)的分類依據(jù)歸類,并整理了各工作構(gòu)建知識(shí)圖譜的方式,圖嵌入方法,以及解決的主要問(wèn)題,以方便讀者查閱。

        表一、 方法總結(jié)   

       2.1 

      基于嵌入的方法

      基于嵌入的方法主要利用知識(shí)圖譜中豐富的語(yǔ)義關(guān)系,來(lái)豐富物品、用戶的表征。這類方法主要包含兩部分:圖嵌入模塊,主要利用圖嵌入的方法學(xué)習(xí)知識(shí)圖譜中實(shí)體和關(guān)系的表征;和推薦模塊,以建模用戶對(duì)物品的偏好。按照這兩個(gè)模塊的結(jié)合方式,可將這一方向的工作劃分為三類。第一類是依次學(xué)習(xí),首先利用圖嵌入算法單獨(dú)訓(xùn)練圖嵌入模塊,隨后將預(yù)先訓(xùn)練好的知識(shí)圖譜表征向量引入到推薦系統(tǒng)中,擴(kuò)充用戶、物品的語(yǔ)言表征,隨后訓(xùn)練推薦模塊,一些代表性的工作包括DKN、KSR、KTGAN等;第二種思路是聯(lián)合學(xué)習(xí),將圖嵌入模塊和推薦模塊的目標(biāo)函數(shù)相結(jié)合,從而實(shí)現(xiàn)端到端的訓(xùn)練,代表性工作包括CKE、CFKG等;第三種思路是引入多任務(wù)學(xué)習(xí)框架,通過(guò)將圖嵌入模塊設(shè)計(jì)成與推薦模塊相關(guān)而又分離的任務(wù),例如知識(shí)圖譜補(bǔ)全,邊預(yù)測(cè)任務(wù),從而利用圖嵌入模塊監(jiān)督推薦模塊的訓(xùn)練過(guò)程,相關(guān)工作包括MKR、KTUP、RCF。

       2.2 

      基于連接的方法

      基于連接的方法主要利用圖譜中實(shí)體間的連接方式做推薦,這類方法大多是將包含物品屬性的知識(shí)圖譜與用戶-物品的交互矩陣相結(jié)合,構(gòu)建用戶-屬性-物品圖,挖掘用戶和物品間的多種連接關(guān)系。這一方向有兩種基本思路,第一種是利用實(shí)體間的連接相似性做推薦,通過(guò)定義圖譜中的基本結(jié)構(gòu)特征,例如元路徑,計(jì)算不同路徑下實(shí)體間的相關(guān)性,作為用戶及物品表征的約束條件,代表性工作包括Hete-CF、FMG等;第二種思路是挖掘用戶與物品之間存在的語(yǔ)義路徑,學(xué)習(xí)實(shí)體間連接路徑的顯式表征,將其引入到推薦框架中,以直接建模用戶與物品間的連接關(guān)系,代表性工作包括MCRec、RKGE等。

       2.3 

      基于傳播的方法

      盡管上述兩類方法都提升了推薦的精準(zhǔn)性,但都沒(méi)有利用圖中所包含的全部信息,比如基于嵌入的方法側(cè)重于學(xué)習(xí)知識(shí)圖譜中的語(yǔ)義表示,而基于連接的方法關(guān)注知識(shí)圖譜中實(shí)體的連接信息?;趥鞑サ姆椒ńY(jié)合了上述兩大思路,其基本思想是借助知識(shí)圖譜中實(shí)體間的連接路徑,將實(shí)體語(yǔ)義表征在圖中傳播,直接建模實(shí)體間的高階關(guān)系,從而更合理地挖掘了知識(shí)圖譜所包含的信息?;趥鞑サ姆椒òN實(shí)現(xiàn)途徑,具體而言,第一種方式基于用戶的歷史行為,通過(guò)聚合用戶歷史交互物品的多跳鄰居來(lái)豐富用戶表征,從而將用戶的歷史興趣在知識(shí)圖譜中沿著向外傳播,這方向的代表性工作包括RippleNet,AKUPM等。第二類方式是將目標(biāo)物品與其多跳鄰居聚合,更新物品的表征。在聚合過(guò)程中,實(shí)體表征的聚合權(quán)重由用戶和目標(biāo)實(shí)體共同決定,從而將用戶的偏好引入到實(shí)體表征的更新過(guò)程中,代表工作包括KGCN等。第三種思路是將用戶物品交互矩陣與包含屬性信息的知識(shí)圖譜相結(jié)合,從而將用戶和物品統(tǒng)一表示在一張圖,并與圖中各自的多跳鄰居表征聚合,豐富用戶與物品的表征,代表工作包括KGAT等。

       2.4 

      本章小結(jié)

      基于嵌入的方法使用圖嵌入算法學(xué)習(xí)知識(shí)圖譜中實(shí)體和關(guān)系的表征,將其整合到推薦系統(tǒng)框架中。其優(yōu)勢(shì)是較為靈活,易于實(shí)踐,但這種方法忽略了實(shí)體間的高階關(guān)系,且往往不具有可解釋性?;谶B接的方法側(cè)重于挖掘用戶與物品在知識(shí)圖譜中的多種連接關(guān)系,其優(yōu)勢(shì)是連接模式往往可以帶來(lái)可解釋性,但往往不適用于用戶與物品交互數(shù)據(jù)稀疏的場(chǎng)景,且將用戶與物品間復(fù)雜的關(guān)系分解為若干連接單元會(huì)損失部分信息?;趥鞑サ姆椒ɑ趫D上傳播機(jī)制,結(jié)合了基于嵌入的方法和基于連接的方法的特點(diǎn),充分挖掘知識(shí)圖譜中的信息。但一個(gè)顯著的缺點(diǎn)是訓(xùn)練過(guò)程需要消耗較多計(jì)算資源,在大規(guī)模數(shù)據(jù)的業(yè)務(wù)場(chǎng)景下需要考慮可擴(kuò)展性。

      我們也簡(jiǎn)要總結(jié)了利用知識(shí)圖譜為推薦結(jié)果帶來(lái)可解釋性的主要技術(shù)手段,包括:1)對(duì)知識(shí)圖譜的關(guān)系嵌入運(yùn)用注意力機(jī)制2)定義元路徑等基本結(jié)構(gòu)單元3)對(duì)連接路徑表征運(yùn)用注意力機(jī)制4)在結(jié)合了用戶與物品交互信息的知識(shí)圖譜中運(yùn)用強(qiáng)化學(xué)習(xí)5)提取基于傳播的方法中實(shí)體聚合的權(quán)重。

      3. 數(shù)據(jù)集

      基于知識(shí)圖譜的推薦系統(tǒng)不僅可以提高推薦效果,帶來(lái)可解釋性,還易于與多種推薦框架相結(jié)合,運(yùn)用于眾多實(shí)際場(chǎng)景。我們將所調(diào)研的工作按照應(yīng)用場(chǎng)景分為七類,包括電影推薦、圖書(shū)推薦、音樂(lè)推薦、新聞推薦、商品推薦、POI推薦以及社交推薦,總結(jié)了每種場(chǎng)景下所使用的的數(shù)據(jù)集與采用的外部知識(shí)圖譜,并按照構(gòu)建知識(shí)圖譜的方法總結(jié)各個(gè)工作。同時(shí),我們也闡述了每種應(yīng)用場(chǎng)景的特點(diǎn),并介紹了每種場(chǎng)景下對(duì)應(yīng)數(shù)據(jù)集的基本信息。為方便讀者查閱本節(jié)內(nèi)容,我們將其總結(jié)于下表。

        表二、數(shù)據(jù)集總結(jié)  

      4. 未來(lái)展望

      除此之外我們也對(duì)這一方向的工作做了展望,包括:

      1)動(dòng)態(tài)推薦:當(dāng)前基于知識(shí)圖譜的推薦算法往往訓(xùn)練時(shí)間較長(zhǎng),成本過(guò)高,適用于靜態(tài)的推薦場(chǎng)景,用戶的興趣在很長(zhǎng)一段時(shí)間內(nèi)保持穩(wěn)定。然而在實(shí)際的業(yè)務(wù)場(chǎng)景中,用戶的興趣往往變化迅速。如何基于實(shí)時(shí)的反饋數(shù)據(jù),動(dòng)態(tài)迭代推薦策略,保證推薦的時(shí)效性,是未來(lái)的研究趨勢(shì)之一

      2)多任務(wù)學(xué)習(xí):知識(shí)圖譜本身存在的一些問(wèn)題也會(huì)成為推薦系統(tǒng)的瓶頸,例如知識(shí)圖譜中事實(shí)信息并不完整,導(dǎo)致實(shí)體間部分關(guān)系缺失,從而可能忽略了用戶的部分偏好。因此可以設(shè)計(jì)與知識(shí)圖譜相關(guān)的任務(wù),例如知識(shí)圖譜補(bǔ)全,將其與推薦系統(tǒng)聯(lián)合訓(xùn)練,以便提高推薦效果。

      3)跨領(lǐng)域推薦:在實(shí)際業(yè)務(wù)場(chǎng)景中,用戶往往會(huì)選購(gòu)不同領(lǐng)域的商品,例如圖書(shū)和電影。不同領(lǐng)域的交互數(shù)據(jù)可以與知識(shí)圖譜自然地結(jié)合在一起,且推薦系統(tǒng)在多種場(chǎng)景下往往具有相似的規(guī)律。因此可以通過(guò)遷移學(xué)習(xí)等技術(shù),通過(guò)共享交互數(shù)據(jù)相對(duì)豐富的源領(lǐng)域的交互特征,緩解目標(biāo)領(lǐng)域數(shù)據(jù)稀疏的問(wèn)題,從而在多個(gè)領(lǐng)域都做出更好的推薦結(jié)果。

      4)結(jié)合知識(shí)的文本表示:在以新聞推薦為代表的推薦場(chǎng)景下,理解文本信息至關(guān)重要。通過(guò)將外部知識(shí)圖譜中的豐富信息引入語(yǔ)言模型訓(xùn)練中,可以獲得更好的文本表示,比如結(jié)合知識(shí)的文本表示方法ERNIE和STCKA,可以用在新聞推薦這樣的文本為主的應(yīng)用里,從而做出更準(zhǔn)確的推薦。

      5. 總結(jié)

      本文調(diào)研了基于知識(shí)圖譜的推薦系統(tǒng)的相關(guān)工作,系統(tǒng)總結(jié)了這一領(lǐng)域的最新進(jìn)展。我們著重闡述了不同研究方法的技術(shù)特點(diǎn)并提出了分類方式,同時(shí)闡述了如何運(yùn)用知識(shí)圖譜為推薦結(jié)果帶來(lái)可解釋性。與此同時(shí),我們也介紹了不同應(yīng)用場(chǎng)景下可供選擇的數(shù)據(jù)集,為入門這一方向提供了可行的建議。最后,我們提出了這個(gè)研究方向存在的發(fā)展趨勢(shì),希望能促進(jìn)這一領(lǐng)域的進(jìn)步與發(fā)展。基于知識(shí)圖譜的推薦系統(tǒng)方興未艾,知識(shí)圖譜中蘊(yùn)含的豐富信息,可以有效提升推薦系統(tǒng)的效果,并帶來(lái)可解釋性。我們希望本文能夠幫助讀者理解這一領(lǐng)域的工作。


      論文下載鏈接

      [1] https://ieeexplore./document/9216015

      [2] http://scis./cn/2020/SSI-2019-0274.pdf

      [3] https://github.com/hongleizhang/RSPapers#knowledge-graph-for-rs

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多