乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      知識圖譜 Recorder︱中文知識圖譜API與工具、科研機構(gòu)與算法框架

       Richard孝恩 2019-07-16

      分為兩個部分,筆者看到的知識圖譜在商業(yè)領(lǐng)域的應(yīng)用,外加看到的一些算法框架與研究機構(gòu)。


      文章目錄

      一、知識圖譜商業(yè)應(yīng)用

      01 唯品金融大數(shù)據(jù)

      使用的是OrientDB,Orientdb提供了大量的接口, 其中最常用的就是Gremlin和sql。

      Gremlin是Apache TinkerPop 框架下的圖遍歷語言。Gremlin是一種函數(shù)式數(shù)據(jù)流語言,可以使得用戶使用簡潔的方式表述復(fù)雜的圖的遍歷或查詢,大部分圖數(shù)據(jù)庫都支持Gremlin。示例圖總共擁有12個節(jié)點(Vertex) 11條邊(Edge)。1521537893115977.png

      唯品金融在使用Orientdb的開發(fā)過程中遇到的最大問題,是數(shù)據(jù)庫初始化時的批量寫入速度較慢, 由于Vertex和Edge數(shù)量在10億數(shù)量級,在沒有優(yōu)化的情況下,單臺服務(wù)器寫入完整數(shù)據(jù)需要幾天。

      這里寫圖片描述


      02 PlantData知識圖譜數(shù)據(jù)智能平臺

      地址:http://www./KGIndex/index.html

      這里寫圖片描述

      PlantData是一個用知識圖譜技術(shù)解決數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)語義、數(shù)據(jù)智能的平臺。

      自主研發(fā)的PlantData圖譜數(shù)據(jù)智能平臺,致力于推進知識圖譜在產(chǎn)業(yè)界的落地發(fā)展,讓數(shù)據(jù)智能更好的支撐商業(yè)智能和人工智能。

      多源異構(gòu)數(shù)據(jù),其中非結(jié)構(gòu)化數(shù)據(jù)有一定比例;

      數(shù)據(jù)中存在一定數(shù)量不同類別的實體;

      業(yè)務(wù)上更加關(guān)注數(shù)據(jù)中實體的關(guān)聯(lián),而不僅僅是數(shù)據(jù)本身…


      03 拍拍貸圖數(shù)據(jù)庫技術(shù)

      目前將用戶信息,設(shè)備信息及社交關(guān)系構(gòu)建了一個異構(gòu)網(wǎng)絡(luò),并將該異構(gòu)網(wǎng)絡(luò)圖應(yīng)用在用戶關(guān)聯(lián)分析及反欺詐檢測場景。

      傳統(tǒng)的方式上,我們的數(shù)據(jù)都是存儲在RDMS上,要查詢用戶的關(guān)聯(lián)關(guān)系的時候,都是通過關(guān)聯(lián)多張表來實現(xiàn)。但是這種方式存在很多的問題:

      • a. 這些表相應(yīng)都較大,在做表關(guān)聯(lián)的時候效率非常低下;
      • b. 對于關(guān)系的層次支持非常有限,出入度很大的結(jié)點,產(chǎn)生的中間結(jié)果會非常大;
      • c. 對于圖上的查詢不夠靈活。

      這些都極大地限制了我們分析能力和分析效率。出于以上這些痛點,我們引入了titan圖形數(shù)據(jù)庫。每天會通過改寫的Titan Bulkload將10億 結(jié)點信息和500億 左右的關(guān)系數(shù)據(jù)導(dǎo)入Titan后臺HBase生成一張包含13類節(jié)點和15類邊的復(fù)雜異構(gòu)網(wǎng)絡(luò)。通過該網(wǎng)絡(luò),可以方便快速地回答以下類似問題:1) 和用戶A關(guān)聯(lián)的用戶有哪些;2) 和用戶A關(guān)聯(lián)的用戶有什么特征;3) 用戶A和用戶B怎么關(guān)聯(lián)在一起的。

      下圖是我們將圖數(shù)據(jù)庫應(yīng)用于反欺詐中的示例圖:

      這里寫圖片描述

      根據(jù)原始的數(shù)據(jù)圖我們可以對用戶做以下調(diào)查分析,來確定特定的用戶是不是欺詐用戶或者是不是與欺詐用戶有關(guān)聯(lián):

      • 通過特定規(guī)則篩選可疑用戶
      • 查看與可疑用戶有特定關(guān)聯(lián)的用戶
      • 查看與可疑用戶有特定關(guān)聯(lián)的所有用戶組成的子網(wǎng)的網(wǎng)絡(luò)特征及用戶特征
      • 分析特定用戶可以通過什么樣的關(guān)聯(lián)關(guān)系關(guān)聯(lián)在一起
      • 最多可分析6層關(guān)聯(lián)關(guān)系的數(shù)據(jù)

      通過該方式,我們大大減少了調(diào)查過程中的工作量,整體效率提升了25% 。


      04 CN-DBpedia

      樣例數(shù)據(jù)文件是txt格式,每行一條數(shù)據(jù),每條數(shù)據(jù)是一個(實體名稱,屬性名稱,屬性值)的三元組,中間用tab分隔,具體如下所示。

      【復(fù)旦大學(xué)?簡稱?復(fù)旦】

      包含900萬 的百科實體以及6700萬 的三元組關(guān)系。其中mention2entity信息110萬 ,摘要信息400萬 ,標(biāo)簽信息1980萬 ,infobox信息4100萬

      該數(shù)據(jù)僅供學(xué)術(shù)研究使用,商用請聯(lián)系我們獲取授權(quán)

      http://kw.fudan.edu.cn/cndbpedia/download/


      05 OpenKG.CN——開放的中文知識圖譜

      中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數(shù)據(jù)的開放與互聯(lián),促進知識圖譜和語義技術(shù)的普及和廣泛應(yīng)用。

      知識圖譜旨在通過建立數(shù)據(jù)之間的關(guān)聯(lián)鏈接,將碎片化的數(shù)據(jù)有機的組織起來, 讓數(shù)據(jù)更加容易被人和機器理解和處理,并為搜索、挖掘、分析等提供便利,為人工智能的實現(xiàn)提供知識庫基礎(chǔ)。知識圖譜涉及的技術(shù)領(lǐng)域包括:知識表示、自然語言理解、智能問答、知識抽取、鏈接數(shù)據(jù)、圖數(shù)據(jù)庫、圖挖掘、常識推理等。

      這里寫圖片描述


      06 楚辭

      楚辭以語義網(wǎng)為理論基礎(chǔ),致力于建設(shè)中文語義知識庫,解決歧義問題,把知識嵌入到各類信息中。

      這里寫圖片描述

      知識結(jié)構(gòu)中有:

      項目描述(DOAP)詞匯集
      項目描述(DOAP)詞匯集使用了W3C的RDF和網(wǎng)絡(luò)本體語義進行描述。

      Muninn墳?zāi)贡倔w
      Muninn墳?zāi)贡倔w的意思是用于處理人類的遺體。

      還有比較好玩的:

      關(guān)于功夫、功法的本體、關(guān)于能力、技能的本體、有關(guān)五行的基礎(chǔ)本體、有關(guān)感覺的基礎(chǔ)本體、有關(guān)癥狀的本體、有關(guān)商業(yè)模式畫布的本體

      聯(lián)誼的nodes,還有幾個方向,不過好像里面沒貨

      這里寫圖片描述


      07 海致大數(shù)據(jù)

      http://www./solution.html

      海致大數(shù)據(jù)核心團隊在參與研發(fā)了全球第一個中文通用知識圖譜平臺之后,致力于將這一大數(shù)據(jù)時代的核心技術(shù)向金融產(chǎn)業(yè)進行垂直化研發(fā),推出了業(yè)界首個金融領(lǐng)域知識圖譜平臺——海致智能金融知識圖譜1.0,其具備強大的自然語言處理能力,包括模板識別、實體識別、情感分析等,也具備領(lǐng)先的關(guān)系挖掘算法引擎,是海致大數(shù)據(jù)多年研發(fā)與客戶服務(wù)的最新成果。

      這里寫圖片描述


      08 騰訊云星圖

      這里寫圖片描述

      是一個圖數(shù)據(jù)庫和圖計算引擎的一體化平臺:融合治理異構(gòu)異質(zhì)數(shù)據(jù);提供關(guān)聯(lián)查詢、可視化圖分析、圖挖掘、機器學(xué)習(xí)和規(guī)則引擎;支持萬億關(guān)聯(lián)關(guān)系數(shù)據(jù)的快速檢索、查找和瀏覽;挖掘隱藏關(guān)系并模型化業(yè)務(wù)經(jīng)驗。作為金融AI風(fēng)控等泛安全領(lǐng)域知識圖譜解決方案,星圖增強企業(yè)業(yè)務(wù),催新商業(yè)模式。

      • 金融
        • 星圖智能平臺運用大數(shù)據(jù)、知識圖譜、人工智能等技術(shù),并圍繞監(jiān)管科技服務(wù)于金融行業(yè),可提升金融機構(gòu)合規(guī)和風(fēng)控能力,從而幫助實現(xiàn)行業(yè)人工智能,為金融環(huán)境快速而穩(wěn)健的發(fā)展貢獻前沿科技的力量。在對公業(yè)務(wù)中,星圖可深耕大數(shù)據(jù),幫助金融合作伙伴存儲其商業(yè)客戶大數(shù)據(jù),梳理客戶關(guān)系以高效挖掘潛在商業(yè)價值;在對私業(yè)務(wù)方面,星圖可在預(yù)測新客戶的潛在風(fēng)險和檢測惡意用戶團伙等方面提供精準(zhǔn)服務(wù)。
      • 泛安全
        • 星圖智能平臺從大數(shù)據(jù)中深度挖掘關(guān)聯(lián)關(guān)系,可準(zhǔn)實時分析多至萬億級海量關(guān)系數(shù)據(jù),轉(zhuǎn)化為關(guān)系圖譜數(shù)據(jù),編織線上線下社交的泛安全專屬知識圖譜。結(jié)合專屬的圖計算引擎、機器學(xué)習(xí)技術(shù)和業(yè)務(wù)專家經(jīng)驗打造泛安全人工智能:線上可幫助新興互聯(lián)網(wǎng)公司梳理用戶關(guān)系實現(xiàn)精準(zhǔn)營銷等,線下可有力支撐公安機關(guān)展開情報研判分析、犯罪團伙跟蹤以及重大事情預(yù)警等。

      09 網(wǎng)感至察

      這里寫圖片描述
      這里寫圖片描述

      10 慧科技術(shù) - 商業(yè)AI(NLP 品牌Logo識別)

      https://www./
      在這里插入圖片描述

      在這里插入圖片描述

      在這里插入圖片描述


      二、相關(guān)科研機構(gòu)與算法框架

      2.1 復(fù)旦大學(xué) Knowledge Works

      http://kw.fudan.edu.cn/

      開源庫、開源工具、創(chuàng)業(yè)項目(數(shù)眼科技)

      2.1.1 開源庫:FudanDNN 基于深度學(xué)習(xí)的中文自然語言處理工具。

      復(fù)旦深度網(wǎng)絡(luò)中文自然語言處理工具FudanDNN-NLP4.0(在3.0的基礎(chǔ)上新增上下文相關(guān)問答。分為兩種情況:第一種情況處理類似上一句問“今天北京天氣如何?”,然后追問“上海呢?”的情況;另一種情況是根據(jù)對話主題展開、轉(zhuǎn)換和遞進給出合適的回答;多輪對話。處理類似訂購機票的場景。不同場景可以根據(jù)對話進展自由切換,并且期間可插入其他問答;海量自定義問答對的高效檢索。檢索匹配時考慮同義詞替換,可根據(jù)發(fā)音相似性糾正可能的錯誤,并且支持一次提問包括多個問題的情況;可為每一位用戶定義各自的上下文信息;圖形客戶端用于系統(tǒng)演示和調(diào)試,支持本地或服務(wù)器快速部署;問答過程中檢測禁用詞功能)
      C 所寫,專門用于商業(yè)環(huán)境
      github:https://github.com/FudanDNN/FudanDNN
      blog:http://homepage.fudan.edu.cn/zhengxq/deeplearning/

      2.1.2 CN-DBpedia接口——解釋型

      提供全套API,并且免費開放使用。如需大規(guī)模調(diào)用請聯(lián)系info.knowledgeworks@gmail.com索取APIKEY。

      • (1) api/cndbpedia/ment2ent

      輸入實體指稱項名稱(mention name),返回對應(yīng)實體(entity)的列表,json格式。

      {'status': 'ok', 'ret': ['紅樓夢(中國古典四大名著之一)', '紅樓夢(2010年李少紅執(zhí)導(dǎo)的古裝情感?。?, '紅樓夢(1987年陳曉旭、歐陽奮強主演央視版電視?。?}
      • 1
      • (2) api/cndbpedia/avpair

      輸入實體名,返回實體全部的三元組知識

      {'status': 'ok', 'ret': [['中文名', '復(fù)旦大學(xué)'], ['英文名稱', 'Fudan University'], ['簡稱', '復(fù)旦·FUDAN'], ['創(chuàng)辦時間', '1905年09月14日'], ['類別', '公立大學(xué)'], ['學(xué)校類型', '綜合']}
      
      • 1
      • (3) api/cndbpedia/value

      給定實體名和屬性名,返回屬性值

      {'status': 'ok', 'ret': ['Fudan University']}
      • 1

      2.1.3 Probaseplus API接口

      • pbapi/getconcepts

      輸入一個英文或中文的實體或概念名,返回其概念列表,返回格式為json格式。

      查詢 航空母艦 的第1-50個概念(第一頁)
      http://:20314/probaseplus/pbapi/getconcepts?kw=航空母艦&start=0 
      返回值:{'numcon': 73, 'concept': [['船', 15], ...]}
      表示航空母艦在CN-Probase中有73個概念,最具有代表性的概念是 船。
      
      • 1
      • 2
      • 3
      • 4

      點評:該接口專用于多義詞

      • pbapi/getentities

      輸入一個英文或中文的概念名,返回其包含的實體列表,返回格式為json格式。

      查詢 水果 的第1-50個實體(第一頁) http://:20314/probaseplus/pbapi/getentities?kw=水果&start=0 返回值:{'entity': [['蘋果', 2100], ['香蕉', 1321], ...], 'nument': 1060} 表示水果在CN-Probase中有1060個實體,如 蘋果,香蕉 等。
      • 1
      • 2
      • 3
      • 4

      點評:該接口專門用于尋找一個實體詞的下屬詞

      2.1.4 CN-Probase接口——概念型

      中文概念圖譜和概念分類體系

      • api/mention2entity

        {“status”: “ok”, “ret”: [“劉德華(中國香港男演員、歌手、詞作人)”, “劉福榮(劉德華別名)”, “劉德華(清華大學(xué)教授)”}

      跟CN-DBpedia中的ment2ent類似,返回實體詞解釋。

      • api/getConcept

      輸入實體,返回實體對應(yīng)概念列表,json格式。

      http:///api/cnprobase/concept?q=劉德華
      {'status': 'ok', 'ret': [['人物', 1299103], ['演員', 59658], ['娛樂人物', 25299], ['歌手', 15884], ['電影人', 88], ['填詞人', 64]], 'count': 6, 'pagesize': 50}
      
      • 1
      • 2

      count:概念數(shù)量;pagesize:每次請求最多返回的概念數(shù)量
      點評:返回了實體詞的屬性,跟CN-DBpedia中的avpair,有點類似

      • api/getEntity

      輸入概念,返回概念對應(yīng)實體列表,json格式。默認(rèn)返回前50個。

      {'status': 'ok', 'ret': [['喬振宇(中國內(nèi)陸男演員)', 321795144], ['霍建華(中國臺灣男演員)', 104187122], ['楊洋(中國內(nèi)陸男演員)', 87598713]}
      • 1

      count:實體數(shù)量;pagesize:每次請求最多返回的實體數(shù)量

      2.1.5 Shorttext Parsing API,短文本依存分析接口

      輸入英文字符串,返回短文本解析的json
      目前比較支持英文

      2.1.6 Entity Understanding API接口

      輸入中文文本,輸出分詞后的文本,以及識別的實體,json格式。

      http:///api/entitylinking/cutsegment?q=打球的李娜和唱歌的李娜不是同一個人
      {'cuts': ['打球', '的', '李娜', '和', '唱歌', '的', '李娜', '不是', '同一個', '人'], 'entities': [[[3, 5], '李娜(中國女子網(wǎng)球名將)'], [[9, 11], '李娜(流行歌手、佛門女弟子)']]}
      
      • 1
      • 2

      輸入一段話,輸出話中的實體詞 實體詞的位置信息

      2.1.7 數(shù)眼科技

      爬蟲模塊(分布式、企業(yè)級的爬蟲任務(wù))
      知識圖譜與概念圖譜,基于知識工場
      中文QA(輸入一段話然后返回內(nèi)容)、[實體鏈接][4]
      未來開放:企業(yè)級圖數(shù)據(jù)庫解決方案(還沒開發(fā)完全)

      2.1.8 額外

      金融新聞Bots,金融類監(jiān)控,根據(jù)關(guān)鍵詞篩選,新聞、網(wǎng)站、軟文;理財產(chǎn)品問答系統(tǒng)
      拼音轉(zhuǎn)漢字服務(wù)


      2.2 思知(OwnThink)

      開放項目:問答機器人、知識庫
      跟 復(fù)旦的Knowledge Works有點相似,估計沒那個全面,開源的聊天機器人也弱爆了。。
      獲取歧義關(guān)系(mention -> entity)

      https://api./ambiguous?mention=蘋果 { 'message': 'success', 'data': [ { '薔薇科蘋果屬果實': [ '蘋果(薔薇科蘋果屬果實)', 10929205 ] }, { '韓國2008年康理貫執(zhí)導(dǎo)電影': [ '蘋果(韓國2008年康理貫執(zhí)導(dǎo)電影)', 7589732 ] } }
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
      • 16
      • 17

      獲取全部知識(entity -> knowledge)
      更詳細(xì)的信息
      https://api./kg?entity=蘋果(薔薇科蘋果屬果實)
      {
      “message”: “success”,
      “data”: {
      “item”: “蘋果(2007年李玉執(zhí)導(dǎo)電影)”,
      “desc”: “《蘋果》是由李玉執(zhí)導(dǎo),范冰冰、佟大為、梁家輝、金燕玲領(lǐng)銜主演的黑色幽默劇情電影。”,
      “eav”: [
      {
      “entity”: “蘋果(2007年李玉執(zhí)導(dǎo)電影)”,
      “value”: “蘋果”,
      “attribute”: “中文名”
      關(guān)聯(lián)圖譜

      https://api./assmap?entity=蘋果
      關(guān)聯(lián)圖譜暫時不對外直接開放(由于某種原因?qū)⒂?018年8月開放)
      
      • 1
      • 2

      2.3 Zhishi.me

      王昊奮,Zhishi.me 通過從開放的百科數(shù)據(jù)中抽取結(jié)構(gòu)化數(shù)據(jù),首次嘗試構(gòu)建中文通用知識圖譜。目前,已融合了三大中文百科,百度百科,互動百科以及維基百科中的數(shù)據(jù)。


      2.4 交大的Acenap

      官方主頁,http://acemap./
      主要做學(xué)術(shù)論文、人群的知識圖譜

      這里寫圖片描述

      • 公開了多款算法(http://acemap./acenap),有不同的軟件版本,python/matlab
      • 公開了多個可視化的方案與算法,http://acemap./acenap/algorithms
      • 提到了幾個公開的數(shù)據(jù)源:社交媒體數(shù)據(jù)源 人人網(wǎng)爬取的人物關(guān)系數(shù)據(jù)源
        • 社交媒體數(shù)據(jù)源:
          • MovieLens This dataset is collected from the MovieLens dataset
            available at https:///datasets/movielens/. In the
            original dataset, the edge weights between users and items, namely
            the users’ ratings on items are decimal ratings in (0,5]. In our
            modified dataset, we map the decimal ratings to interger ratings in
            range [1,10].
          • AudioSrobbler This dataset is collected from the AudioSrobbler
            dataset available at
            http://www-etud.iro./~bergstrj/audioscrobbler_data.html.
            In the original dataset we are provided with users’ play counts for
            each music artist they have listened to. In our modified dataset, we
            mapped play counts to bounded edge weights between users and items
            i.e. users’ ratings as integers in [1,5].
          • BookCrossing This dataset is collected from the BookCrossing dataset
            available at http://www2.informatik./~cziegler/BX/. In
            the original dataset, we are provided with the users’ implicit and
            explicit ratings on books. In our modified dataset, we use integers
            in [1,10] to present the explicit user ratings and exculde ratings of
            0, which denote implicit ratings.

      2.5 清華大學(xué)的openKE

      由 THUNLP 基于 TensorFlow 工具包開發(fā)

      該框架有如下特征:

      • 擁有配置多種訓(xùn)練環(huán)境和經(jīng)典模型的簡易接口;
      • 對高性能 GPU 訓(xùn)練進行加速和內(nèi)存優(yōu)化;
      • 高效輕量級的 C 實現(xiàn),用于快速部署和多線程加速;
      • 現(xiàn)有大規(guī)模知識圖譜的預(yù)訓(xùn)練嵌入,可用于多種相關(guān)任務(wù);
      • 長期維護以修復(fù) bug,滿足新需求。

      TransE 、TransH、TransR、TransD、RESCAL、DistMult、HolE、ComplEx等算法的統(tǒng)一接口的高效實現(xiàn);
      面向WikiData和Freebase兩大通用KG全量數(shù)據(jù)的預(yù)訓(xùn)練好的知識表示模型下載,不需要大家再費心重復(fù)訓(xùn)練


      2.6 自然語言處理工具包HanLP

      HanLP是由一系列模型與算法組成的NLP工具包,目標(biāo)是普及自然語言處理在生產(chǎn)環(huán)境中的應(yīng)用。HanLP具備功能完善、性能高效、架構(gòu)清晰、語料時新、可自定義的特點。

      有py和java版本的,分別是:
      pyhanlp: Python interfaces for HanLP
      HanLP: Han Language Processing

      從分詞、詞性標(biāo)注、命名實體識別、關(guān)鍵詞提取、短語提取、文本推薦(語義推薦、拼音推薦、字詞推薦)、依存句法分析等功能,很全面。

      2.7 scikit-kge: MIT知識圖譜embedding工具包

      地址:https://github.com/mnick/scikit-kge
      此工具包是有麻省理工大學(xué)( MIT )開發(fā)的python庫,可用不同方法訓(xùn)練得到知識圖譜的分布式表示結(jié)果,包含的知識圖譜表示學(xué)習(xí)方法有:
      Holographic Embeddings (HolE)
      RESCAL
      TransE
      TransR
      ER-MLP

      2.8 RDFox: 牛津大學(xué)的知識庫推理工具(推薦)

      OpenKG搜集和整理知識圖譜相關(guān)的技術(shù)工具,并將組織開展技術(shù)評測。

      RDFox是一個高度可擴展的內(nèi)存RDF三元組存儲,支持共享內(nèi)存并行OWL 2 RL推理。 它是用C 編寫的跨平臺軟件,帶有一個Java包裝器,允許與任何基于Java的解決方案(包括OWL API)輕松集成。


      2.9 中國知網(wǎng)

      同時,知網(wǎng)內(nèi)的NLP結(jié)構(gòu)也非常復(fù)雜,參考:http://www./zhiwang/c_zhiwang.html
      知網(wǎng)描述了下列各種關(guān)系:

      (a) 上下位關(guān)系 (由概念的主要特征體現(xiàn),請參看《知網(wǎng)管理工具》)

      (b) 同義關(guān)系(可通過《同義、反義以及對義組的形成》獲得)

      ? 反義關(guān)系(可通過《同義、反義以及對義組的形成》獲得)

      (d) 對義關(guān)系(可通過《同義、反義以及對義組的形成》獲得)

      (e) 部件-整體關(guān)系(由在整體前標(biāo)注 % 體現(xiàn),如'心','CPU'等)

      (f) 屬性-宿主關(guān)系(由在宿主前標(biāo)注 & 體現(xiàn),如'顏色','速度'等)

      (g) 材料-成品關(guān)系(由在成品前標(biāo)注 ? 體現(xiàn),如'布','面粉'等)

      (h) 施事/經(jīng)驗者/關(guān)系主體-事件關(guān)系(由在事件前標(biāo)注 * 體現(xiàn),如'醫(yī)生','雇主'等)

      (i) 受事/內(nèi)容/領(lǐng)屬物等-事件關(guān)系(由在事件前標(biāo)注 $ 體現(xiàn),如'患者','雇員'等)

      (j) 工具-事件關(guān)系(由在事件前標(biāo)注 * 體現(xiàn),如'手表','計算機'等)

      (k) 場所-事件關(guān)系(由在事件前標(biāo)注 @ 體現(xiàn),如'銀行','醫(yī)院'等)

      (l) 時間-事件關(guān)系(由在事件前標(biāo)注 @ 體現(xiàn),如'假日','孕期'等)

      (m) 值-屬性關(guān)系(直接標(biāo)注無須借助標(biāo)識符,如'藍(lán)','慢'等)

      (n) 實體-值關(guān)系(直接標(biāo)注無須借助標(biāo)識符,如'矮子','傻瓜'等)

      (o) 事件-角色關(guān)系(由加角色名體現(xiàn),如'購物','盜墓'等)

      § 相關(guān)關(guān)系(由在相關(guān)概念前標(biāo)注 # 體現(xiàn),如'谷物','煤田'等)

      同時還有API:介紹知網(wǎng)知識庫的 API 參數(shù)與調(diào)用過程,當(dāng)日調(diào)用接口的次數(shù)不得超過5000次
      詞語相似度檢測/中文分析/英文分析/詞語相關(guān)性檢測
      知網(wǎng)的api是在一個語知的平臺:http:///chnParse.html

      這里寫圖片描述

      知網(wǎng)內(nèi)容期刊查詢的時候,也支持知識圖譜:

      這里寫圖片描述

      這里寫圖片描述

      這里寫圖片描述

      這里寫圖片描述

      延伸:語知科技的接口非常豐富!

      • 有關(guān)系抽取接口:判案要素抽取、金融事件抽取、公司以及機構(gòu)名抽?。ㄔ诟拢?/li>
      • 文本語義解析接口、詞語相關(guān)、句子相關(guān)性、篇章相關(guān)性;
      • 基礎(chǔ)接口:詞語拼音、詞性判定、自動分詞、詞性標(biāo)注、英文釋義(機器翻譯?)

      每天有5000次免費調(diào)用額度
      這里寫圖片描述

      這里寫圖片描述

      語知科技在語義分析方面優(yōu)勢明顯,它可以處理的文本可以是超句的段落或篇章,并且系統(tǒng)的分析結(jié)果可揭示五種類型的內(nèi)容:詞語之間的句法關(guān)系,詞語之間的邏輯語義關(guān)系,詞語之間的深層邏輯語義關(guān)系,通過邏輯語義角色轉(zhuǎn)換得到的深層理解,以及各個詞語的詞性、義項、拼音及其對應(yīng)的英語譯文。

      可參考:基于HowNet的NLP技術(shù),語知科技打造新型語言理解技術(shù)服務(wù)平臺


      2.10 浙江大學(xué):創(chuàng)新設(shè)計產(chǎn)品庫

      url:http://120.55.82.39:8080/index.html

      這里寫圖片描述

      這里寫圖片描述

      這里寫圖片描述

      這里寫圖片描述

      2.11 中草藥知識服務(wù)系統(tǒng)

      http://zcy./tcm/

      好厲害,有知識圖譜,有KGQA問答系統(tǒng),還有主題建模,各種專業(yè)分詞工具。
      還有以圖搜圖功能,尼瑪,逆天?。?/p>

      這里寫圖片描述

      這里寫圖片描述

      這里寫圖片描述

      這里寫圖片描述

      這里寫圖片描述


      2.12 中國工程科技知識中心

      http://www./portal/hotspotdetail18
      依據(jù)時間,關(guān)鍵詞等信息對內(nèi)容進行展示
      這里寫圖片描述

      2.13 NLPIR

      http://ictclas./nlpir/
      基于詞語的多度傳播,簡單的詞關(guān)聯(lián)邏輯。

      這里寫圖片描述

      這里寫圖片描述

      2.14 開放域中文知識圖譜《大詞林》

      http://www./hypernym/?q=女仆咖啡廳

      這里寫圖片描述

      2.15 北航 - 中文知識圖譜

      http://www./linking/

      在這里插入圖片描述

      在這里插入圖片描述

      在這里插入圖片描述

      在這里插入圖片描述

      在這里插入圖片描述


      延伸一:一文揭秘!自底向上構(gòu)建知識圖譜全過程

      知識圖譜的構(gòu)建技術(shù)主要有自頂向下和自底向上兩種。其中自頂向下構(gòu)建是指借助百科類網(wǎng)站等結(jié)構(gòu)化數(shù)據(jù)源,從高質(zhì)量數(shù)
      據(jù)中提取本體和模式信息,加入到知識庫里。而自底向上構(gòu)建,則是借助一定的技術(shù)手段,從公開采集的數(shù)據(jù)中提取出資源模式,選擇其中置信度較高的信息,加入到知識庫中。
      本篇文章很基礎(chǔ)的解釋了知識圖譜的底層結(jié)構(gòu),很贊!

      這里寫圖片描述


      **公眾號“素質(zhì)云筆記”定期更新博客內(nèi)容:**
      ![這里寫圖片描述](https://img-blog.csdn.net/20180226155348545?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2luYXRfMjY5MTczODM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70)

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多