乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      到底哪款OCR軟件識(shí)別率最高?免費(fèi)版居然表現(xiàn)最佳?

       網(wǎng)羅燈下黑 2020-11-12

      OCR軟件想必大家都在用,不管是學(xué)生黨還是上班狗,遇到?jīng)]有電子文檔的時(shí)候,拿起手機(jī)拍一張,稍稍校對(duì)修改一下就能省去手打的麻煩,實(shí)在是生產(chǎn)力利器。

      然而問題來了,市面上這么多的OCR工具,到底哪款軟件最好用呢?網(wǎng)上有不少文章介紹了很多各種各樣的OCR工具,多是從功能方面介紹,很少有針對(duì)識(shí)別率進(jìn)行對(duì)比的,到底哪個(gè)識(shí)別率最高呢?

      黑哥今天就嘗試著做個(gè)小實(shí)驗(yàn),對(duì)比一下到底哪款軟件最給力!

      特別說明:為充分對(duì)比軟件識(shí)別效果,本文圖多,如果不想看細(xì)節(jié)對(duì)比(都是我的心血啊,好意思嗎?)可以直接拉到最后看結(jié)果。

      一、評(píng)測(cè)準(zhǔn)備

      本次選中的是Textgrabber、掃描全能王以及白描這三款。

      1、主角背景:

      A.textgrabber 如果你在電腦上用過ABBYY FineReader Professional,那么你就不會(huì)對(duì)這款軟件感到陌生,都是由OCR界的扛把子ABBYY開發(fā)的,在文檔識(shí)別,數(shù)據(jù)捕獲和語(yǔ)言技術(shù)的開發(fā)中居世界領(lǐng)先地位。

      B.掃描全能王 一款國(guó)產(chǎn)軟件,其公司在OCR、人工智能、手寫識(shí)別、圖像處理及自動(dòng)圖像增強(qiáng)等領(lǐng)域達(dá)到世界領(lǐng)先水平。核心產(chǎn)品名片全能王全球下載用戶超過3億人,掃描全能王全球下載用戶3.4億。

      C.白描 這個(gè)軟件名氣不大,出自國(guó)人獨(dú)立開發(fā)者之手,開發(fā)者陶新樂,一名 iOS 軟件工程師。

      為什么會(huì)拿一款獨(dú)立軟件去跟大廠去懟呢,別著急,往下看你就明白了。

      大家知道,作為OCR軟件,我們最關(guān)心的就是識(shí)別率,因此,本次主要從這個(gè)方面進(jìn)行評(píng)測(cè)對(duì)比。

      另外,考慮到大家最常用的使用環(huán)境是中文、英文文檔識(shí)別,將對(duì)中文、英文、中英文混排三種應(yīng)用場(chǎng)景分別進(jìn)行對(duì)比。

      2、參評(píng)軟件版本號(hào):

      Textgrabber:iOS 平臺(tái) 6.5.0.1

      掃描全能王:Android 平臺(tái) 5.4.0

      白描:Android 平臺(tái) 1.0.4

      別問我為啥平臺(tái)不統(tǒng)一,textgrabber是App Store限免的時(shí)候入的,為了省錢唄。。。

      目前三款軟件均支持iOS和Android。

      3、校對(duì)軟件:Word 2016

      簡(jiǎn)單介紹一下校對(duì)過程,在 Word 2016 里面打開審閱標(biāo)簽,選中對(duì)比,即可對(duì)原文本與目標(biāo)文本進(jìn)行對(duì)比。中間為校對(duì)區(qū),右上為軟件識(shí)別文本,右下為原稿。

      實(shí)際過程中發(fā)現(xiàn)對(duì)比也會(huì)有判斷錯(cuò)誤的地方,如果大家有更好的文本對(duì)比軟件,可以介紹給我。

      4、原文件 為了盡量減少拍照這一環(huán)節(jié)對(duì)識(shí)別結(jié)果的影響,在識(shí)別對(duì)比時(shí),采用的是同一張照片導(dǎo)入三個(gè)軟件進(jìn)行分別識(shí)別,字號(hào)均為五號(hào)字。

      二、中文文檔識(shí)別

      本文檔來自《三體》,共1155個(gè)字符。

      Textgrabber

      經(jīng)與原文對(duì)比,共檢查出113處修訂。

      錯(cuò)誤表現(xiàn):

      1、首行縮進(jìn)均未能正確識(shí)別。

      2、標(biāo)點(diǎn)符號(hào)識(shí)別錯(cuò)誤,中文雙引號(hào)“識(shí)別為英文引號(hào)"。

      3、部分字符識(shí)別錯(cuò)誤,汪淼識(shí)別為汪森。

      4、文本識(shí)別丟失。

      5、右側(cè)邊緣文本會(huì)莫名其妙插入空格。

      掃描全能王

      經(jīng)與原文對(duì)比,共檢查出103處修訂。

      錯(cuò)誤表現(xiàn):

      1、首行縮進(jìn)均未能正確識(shí)別。

      2、標(biāo)點(diǎn)符號(hào)識(shí)別錯(cuò)誤,中文雙引號(hào)識(shí)別為英文引號(hào),省略號(hào)……識(shí)別為······

      3、在原文換行處錯(cuò)誤識(shí)別為斷行,沒有糾正為自動(dòng)連接。

      4、字符識(shí)別錯(cuò)誤比例低于abbyy,更多來自于格式以及換行錯(cuò)誤。

      白描

      共檢查出71處修訂。

      錯(cuò)誤表現(xiàn):

      1、首行縮進(jìn)均未能正確識(shí)別。(目前所有OCR軟件的通病,后邊不再一一列出。)

      2、大部分錯(cuò)誤來自標(biāo)點(diǎn)符號(hào)識(shí)別錯(cuò)誤,特別是段首的標(biāo)點(diǎn)部分丟失,段尾的標(biāo)點(diǎn)符號(hào)幾乎全部丟失,但識(shí)別到的中文雙引號(hào)基本正確,不存在錯(cuò)誤識(shí)別為英文引號(hào)。

      3、亮點(diǎn)在于文字的識(shí)別率幾乎是100%,僅就本測(cè)試文檔來說,文字全部識(shí)別正確。

      小結(jié):白描的文字識(shí)別率出乎意料地高,而且對(duì)原文版式的還原最準(zhǔn)確,很少出現(xiàn)錯(cuò)誤斷行的情況。缺點(diǎn)在于對(duì)標(biāo)點(diǎn)符號(hào)的識(shí)別上,段首標(biāo)點(diǎn)部分識(shí)別,段末全部陣亡,經(jīng)與作者反饋,證實(shí)確實(shí)存在這種情況,將在后續(xù)版本進(jìn)行優(yōu)化。

      中文識(shí)別率排名:白描>textgrabber>掃描全能王

      三、英文文檔 

      出處忘了,好像是來自一篇小說吧,共498字。

      Textgrabber

      共檢查出27處修訂。

      錯(cuò)誤表現(xiàn):

      1、單詞識(shí)別率很高,個(gè)別單詞存在識(shí)別錯(cuò)誤。

      2、部分單詞識(shí)別丟失。

      3、個(gè)別標(biāo)點(diǎn)符號(hào)識(shí)別錯(cuò)誤。整體來說識(shí)別率很高。

      掃描全能王

      共檢查出107處修訂。

      錯(cuò)誤表現(xiàn):

      1、部分單詞識(shí)別錯(cuò)誤,準(zhǔn)確率要低于abbyy,但優(yōu)于白描。

      2、一個(gè)奇怪的發(fā)現(xiàn)是word文檔對(duì)比時(shí)將掃描全能王的部分識(shí)別結(jié)果全部判定為錯(cuò)誤,而實(shí)際上當(dāng)我把眼看瞎了也沒發(fā)現(xiàn)錯(cuò)在何處,所以實(shí)際的正確率是要高于對(duì)比結(jié)果的,難道word跟這貨有仇嗎?

      4、掃描全能王一貫的老毛病依然存在,在換行處未能正確識(shí)別,出現(xiàn)多處斷行。

      5、部分大小寫識(shí)別錯(cuò)誤。

      白描

      共檢查出141處修訂。

      錯(cuò)誤表現(xiàn):

      1、單詞識(shí)別正確率較高,但由于多處大小寫未能正確識(shí)別,拉低了識(shí)別率。

      2、單詞之間的空格出現(xiàn)大面積識(shí)別丟失。

      3、習(xí)慣性未能識(shí)別出每段段尾的標(biāo)點(diǎn)符號(hào),及部分段首的標(biāo)點(diǎn)符號(hào)。

      4、個(gè)別情況出現(xiàn)斷行錯(cuò)誤。

      小結(jié):在這個(gè)環(huán)節(jié),國(guó)際大廠出品的textgrabber不負(fù)眾望,對(duì)英文的識(shí)別率及其優(yōu)異,包括對(duì)原文版式的還原也非常不錯(cuò)。從校對(duì)結(jié)果就能看出很少出現(xiàn)紅色勘誤。白描在這個(gè)環(huán)節(jié)表現(xiàn)較差,容易出現(xiàn)空格丟失以及大小寫識(shí)別錯(cuò)誤,在英文文本識(shí)別中非常吃虧。掃描全能王的表現(xiàn)介于兩者之間,同樣是識(shí)別率不錯(cuò),但斷行習(xí)慣性出錯(cuò)。

      英文識(shí)別率排名:textgrabber>掃描全能王>白描

      四、中英文混排文檔

      出處來自于威鋒一篇帖子,759字。

      Textgrabber

      共檢查出69處修訂。

      錯(cuò)誤表現(xiàn):

      1、文本識(shí)別結(jié)果習(xí)慣性在右側(cè)邊緣會(huì)莫名其妙插入空格。

      2、部分字符識(shí)別錯(cuò)誤,如將mbp15識(shí)別為mbpl5。

      3、個(gè)別標(biāo)點(diǎn)識(shí)別錯(cuò)誤。

      掃描全能王

      共檢查出182處修訂。

      錯(cuò)誤表現(xiàn):

      1、依然在換行處未能正確識(shí)別,出現(xiàn)多處錯(cuò)誤斷行。

      2、中英文混排的字符出現(xiàn)部分識(shí)別錯(cuò)誤,如fy識(shí)別為行,firefox識(shí)別為firefo×。

      3、標(biāo)點(diǎn)符號(hào)識(shí)別錯(cuò)誤率較高。

      白描

      共檢查出142處修訂。

      錯(cuò)誤表現(xiàn):

      1、習(xí)慣性問題依然存在,未能識(shí)別出每段段尾的標(biāo)點(diǎn)符號(hào),及部分段首的標(biāo)點(diǎn)符號(hào)。

      2、中文識(shí)別率較高,中英文混排識(shí)別率一般,如將html5test識(shí)別為ntml5test。

      3、標(biāo)點(diǎn)符號(hào)錯(cuò)誤率較高。

      小結(jié):該環(huán)節(jié)各家表現(xiàn)綜合了前兩輪表現(xiàn)特點(diǎn),textgrabber在該環(huán)節(jié)依然穩(wěn)健,沒有特別明顯的短板,白描和掃描全能王在前兩環(huán)節(jié)的亮點(diǎn)和缺點(diǎn)也延續(xù)在此環(huán)節(jié),綜合來看,textgrabber表現(xiàn)最佳。

      中英文混排識(shí)別率排名:textgrabber>白描>掃描全能王

      五、綜合對(duì)比

      1、識(shí)別率

      白描作為一款獨(dú)立應(yīng)用,中文的識(shí)別率出乎意料地令人印象深刻,同時(shí)對(duì)原文版式的還原度最高,如果后期對(duì)標(biāo)點(diǎn)符號(hào)識(shí)別繼續(xù)優(yōu)化的話,在中文識(shí)別領(lǐng)域里幾乎就不存在對(duì)手了。

      大廠出品的textgrabber表現(xiàn)最為穩(wěn)定,畢竟是號(hào)稱OCR界的老大,延續(xù)了桌面到手機(jī)端的優(yōu)勢(shì),其對(duì)英文識(shí)別的準(zhǔn)確度可謂賞心悅目。

      掃描全能王的識(shí)別率在于兩者之間,沒有特別明顯的短板,但也沒有特別優(yōu)異的亮點(diǎn)。它的優(yōu)勢(shì)在于對(duì)文檔掃描及文檔管理上,但在識(shí)別這個(gè)環(huán)節(jié)表現(xiàn)中庸。

      總的來說,識(shí)別中文文檔推薦白描,識(shí)別英文文檔推薦 Textgrabber。

      2、性價(jià)比

      相較于TextGrabber 30元,和掃描全能王 30 元/月的相比,白描Android版普通版免費(fèi),iOS版 6 元的入門價(jià)格幾乎稱得上是白菜價(jià)啦!

      必須值得一提的是,白描的iOS版還支持表格掃描,其余兩款均不支持。為了嘗試這個(gè)功能,我還特地付費(fèi)下載測(cè)試了一下,雖然在識(shí)別格式上還存在很多優(yōu)化的空間,但總歸邁出了值得期待的一步!

      對(duì)了,白描還有個(gè)特別酷炫的功能,其他兩款都沒有,那就是支持最多9張圖片的批量OCR識(shí)別,并且還能合并為一個(gè)文檔!

      不然這些爆炸好評(píng)怎么來的——

      你說,識(shí)別率這么高,還賣得這么便宜,你還讓不讓別人活了,黑哥覺得這款軟件賣個(gè)三四十塊它一點(diǎn)都不貴呀!要下的趁早,說不定哪天就真的提價(jià)了,我已經(jīng)在iOS和Android上都已付費(fèi)購(gòu)買,這款良心軟件真的值得付費(fèi)支持!

        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多