乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      自然語(yǔ)言處理工具python調(diào)用hanlp中文實(shí)體識(shí)別

       昵稱16619343 2019-02-13

      Hanlp作為一款重要的中文分詞工具,在GitHub的用戶量已經(jīng)非常之高,應(yīng)該可以看得出來(lái)大家對(duì)于hanlp這款分詞工具還是很認(rèn)可的。本篇繼續(xù)分享一篇關(guān)于hanlp的使用實(shí)例即Python調(diào)用hanlp進(jìn)行中文實(shí)體識(shí)別。

      想要在python中調(diào)用hanlp進(jìn)行中文實(shí)體識(shí)別,Ubuntu 16.04的系統(tǒng)環(huán)境

      1.安裝jpype1,在cmd窗口輸入

      pip install jpype1

      2.下載hanlp的安裝包

      https://github.com/hankcs/HanLP/releases

      1)下載新的 hanlp-1.7.1-release.zip文件,里面包含hanlp-1.7.1.jar , hanlp-1.7.1-sources.jar , hanlp.properties

      2)點(diǎn)擊data-for-1.7.1.zip下載。(底下第8條)

      注:如果你在http://hanlp./services.html點(diǎn)擊下載hanlp.jar,下載下來(lái)的是hanlp-1.2.8.jar。之后在使用過(guò)程中可能會(huì)出現(xiàn)“字符類型對(duì)應(yīng)表加載失敗”的錯(cuò)誤,查看相應(yīng)路徑下也沒(méi)有CharType.dat.yes文件。原因可能是hanlp-1.2.8版本過(guò)低,使用新版本應(yīng)該不會(huì)出現(xiàn)這個(gè)問(wèn)題。

      3.新建一個(gè)文件夾Hanlp,放文件hanlp-1.7.1.jar和hanlp.properties文件

      新建一個(gè)文件夾hanlp,放data-for-1.7.1.zip解壓后的文件

      配置hanlp.properties中的第一行的root為hanlp文件夾的位置,也就是data-for-1.7.1.zip解壓后的文件放的位置。

      4.寫(xiě)py文件調(diào)用hanlp進(jìn)行中文分析。

      用法可參考這個(gè)博客 blog.csdn.net/u011961856/article/details/77167546。

      另,查看HanLP關(guān)于實(shí)體識(shí)別的文檔http://hanlp./doc.html

      里面介紹說(shuō)中文人名標(biāo)注為“nr”,地名標(biāo)注為“ns”,機(jī)構(gòu)名標(biāo)注為“nt”,所以使用用法參考鏈接里的NLPTokenizer.segment就可以標(biāo)注出中文句子中的人名,地名和機(jī)構(gòu)名。

      比較使用jieba進(jìn)行詞性標(biāo)注時(shí),也可以標(biāo)注出中文句子中的人名,地名和機(jī)構(gòu)名。jieba分詞的詞性說(shuō)明:

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多