文章詳情頁

如何使用Python進(jìn)行PDF圖片識(shí)別OCR

瀏覽：9日期：2022-06-29 11:54:07

使用場(chǎng)景

使用圖片識(shí)別可以快速提取圖片中的信息，方便高效。

Python并不能直接對(duì)PDF進(jìn)行識(shí)別，所以如果是識(shí)別PDF的話，需要先將PDF轉(zhuǎn)化為圖片，然后再進(jìn)行識(shí)別。

必備工具 Python

可以安裝3.7及以上版本

tesseract-ocr

下載地址： https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可

需要用到的庫

pip install pillowpip install opencv-pythonpip install fitzpip install PyMuPDFpip install pytesseract代碼示例

from PIL import Imageimport osimport pytesseract import cv2 as cvimport fitzdef pdf_image(pdfPath,imgPath,zoom_x,zoom_y,rotation_angle): # 打開PDF文件 pdf = fitz.open(pdfPath) # 逐頁讀取PDF for pg in range(0, pdf.pageCount): page = pdf[pg] # 設(shè)置縮放和旋轉(zhuǎn)系數(shù) trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotation_angle) pm = page.getPixmap(matrix=trans, alpha=False) # 開始寫圖像 pm.writePNG(imgPath+str(pg)+'.png') #pm.writePNG(imgPath) pdf.close()pdf_path =’D:/123.pdf’img_path =’D:/123.png’pdf_image(pdf_path,img_path,5,5,0)# 依賴opencvimg=cv.imread(img_path)text=pytesseract.image_to_string(Image.fromarray(img),lang=’chi_tra’)# 不依賴opencv寫法# text=pytesseract.image_to_string(Image.open(img_path))print(text)總結(jié)

識(shí)別清晰的文字圖片的時(shí)候準(zhǔn)確率非常高

但是識(shí)別手寫體的話效果不太好

注意事項(xiàng)

在安裝tesseract-ocr 的時(shí)候一定要記得選擇對(duì)應(yīng)的語言，不然是無法正常使用的。

以上就是如何使用Python進(jìn)行PDF圖片識(shí)別OCR的詳細(xì)內(nèi)容，更多關(guān)于python pdf圖片識(shí)別ocr的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

Python 編程

上一條：python將YUV420P文件轉(zhuǎn)PNG圖片格式的兩種方法下一條：python實(shí)現(xiàn)簡(jiǎn)單的井字棋游戲(gui界面)

相關(guān)文章：

1. HTTP協(xié)議常用的請(qǐng)求頭和響應(yīng)頭響應(yīng)詳解說明（學(xué)習(xí)）2. jscript與vbscript 操作XML元素屬性的代碼3. 不要在HTML中濫用div4. HTML5實(shí)戰(zhàn)與剖析之觸摸事件(touchstart、touchmove和touchend)5. XML入門的常見問題(三)6. Vue如何使用ElementUI對(duì)表單元素進(jìn)行自定義校驗(yàn)及踩坑7. HTML DOM setInterval和clearInterval方法案例詳解8. XML 非法字符（轉(zhuǎn)義字符）9. XML在語音合成中的應(yīng)用10. CSS清除浮動(dòng)方法匯總

排行榜

					
					JavaScript函數(shù)重載操作實(shí)例淺析
PHP擴(kuò)展之壓縮與歸檔擴(kuò)展1——Bzip2
Android實(shí)現(xiàn)動(dòng)態(tài)改變shape.xml中圖形的顏色
python GUI庫圖形界面開發(fā)之PyQt5滑塊條控件QSlider詳細(xì)使用方法與實(shí)例
python使用ctypes庫調(diào)用DLL動(dòng)態(tài)鏈接庫
Java基于注解實(shí)現(xiàn)的鎖實(shí)例解析
老虎身上的斑紋－－－正確使用JAVA1.5里的Annotation
ASP.NET MVC實(shí)現(xiàn)橫向展示購物車
Spring EL表示式的運(yùn)用@Value說明
python正則表達(dá)式re.match()匹配多個(gè)字符方法的實(shí)現(xiàn)
Python 如何將integer轉(zhuǎn)化為羅馬數(shù)(3999以內(nèi))