【導(dǎo)語】:將圖片中的公式變成 LaTeX 格式。 簡介image-to-latex 是一個(gè)能將 LaTeX 數(shù)學(xué)方程的圖像映射到 LaTeX 代碼的應(yīng)用程序。 Yuntian Deng 等人在 2016 年提出并嘗試了 image-to-markup 的問題。他們通過解析來自 arXiv 的 LaTeX 論文來源,提取了大約 10 萬個(gè)公式。他們使用 pdflatex 渲染公式并將渲染的 PDF 文件轉(zhuǎn)換為 PNG 格式。在他們的模型中,首先使用 CNN 來提取圖像特征。然后使用 RNN 對特征行進(jìn)行編碼。 最后,編碼特征由 RNN 解碼器使用。該模型共有 948 萬個(gè)參數(shù)。最近,Transformer 在很多語言任務(wù)上都超過了 RNN,所以作者在這個(gè)問題上進(jìn)行了新的嘗試。 項(xiàng)目地址: https://github.com/kingyiusuen/image-to-latex 下載安裝安裝將源代碼 clone 到本地文件夾: git clone https://github.com/kingyiusuen/image-to-latex.git 創(chuàng)建名稱為 venv 的虛擬環(huán)境,并安裝所需的包:
數(shù)據(jù)預(yù)處理運(yùn)行以下命令下載 im2latex 數(shù)據(jù)集并進(jìn)行所有預(yù)處理,圖像裁剪步驟可能需要一個(gè)多小時(shí)。 python scripts/prepare_data.py 部署創(chuàng)建 API 以使用經(jīng)過訓(xùn)練的模型進(jìn)行預(yù)測。使用以下命令啟動并運(yùn)行服務(wù)器:
可以通過 http://0.0.0.0:8000/docs 上生成的文檔查看 API 的使用方法。 模型架構(gòu)運(yùn)行例子- EOF - 重磅!程序員交流群已成立公眾號運(yùn)營至今,離不開小伙伴們的支持。為了給小伙伴們提供一個(gè)互相交流的平臺,特地開通了程序員交流群群里有不少技術(shù)大神,不時(shí)會分享一些技術(shù)要點(diǎn),更有一些資源收藏愛好者不時(shí)分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。(群完全免費(fèi),不廣告不賣課!) |
|