hello大家好,前幾天老Y在github上閑逛,發(fā)現(xiàn)了一個大神項目,這個工具已經(jīng)被標星將近5K,可見其受歡迎程度。 這個工具叫Tabula,它是用于提取pdf中的數(shù)據(jù)表格工具。我們知道pdf中的數(shù)據(jù)表格,不好復制,即使用文字識別工具也未能很好的識別,更別說直接生成excel表格了。 而Table可以將pdf中的數(shù)據(jù)直接提取到csv或excel表格中,很實用很方便的一個工具。Table支持Windows、Mac OS X、Linux三大系統(tǒng)。 下面老Y在windows中用個例子說明一下。 在Windows中,工具下載后只有一個exe文件如下圖所示,使用方法很簡單直接雙擊就可以了。 運行后會自動跳出網(wǎng)頁,如果沒有自動跳出,在瀏覽器輸入http://localhost:8080即可. |
|