python PDF文件转JPG
生活随笔
收集整理的這篇文章主要介紹了
python PDF文件转JPG
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
參考博文:https://zhuanlan.zhihu.com/p/162770223
import os import fitzbase_path = 'F:/workshop/chineseocr-app/train/data/invoice/PDF/' filenames = os.listdir(base_path) OUT_PATH = 'F:/workshop/chineseocr-app/train/data/invoice/IMG/'for filename in filenames:full_path = os.path.join(base_path, filename) # 拼接,得到PDF文件的絕對路徑print(full_path)doc = fitz.open(full_path) # 打開一個PDF文件,doc為Document類型,是一個包含每一頁PDF文件的列表rotate = int(0) # 設(shè)置圖片的旋轉(zhuǎn)角度zoom_x = 2.0 # 設(shè)置圖片相對于PDF文件在X軸上的縮放比例zoom_y = 2.0 # 設(shè)置圖片相對于PDF文件在Y軸上的縮放比例trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)print("%s開始轉(zhuǎn)換..." % filename)if doc.pageCount > 1: # 獲取PDF的頁數(shù)for pg in range(doc.pageCount):page = doc[pg] # 獲得第pg頁pm = page.getPixmap(matrix=trans, alpha=False) # 將其轉(zhuǎn)化為光柵文件(位數(shù))new_full_name = filename.split(".")[0] # 保證輸出的文件名不變pm.writeImage(OUT_PATH+"%s%s.jpg" % (new_full_name, pg)) # 將其輸入為相應(yīng)的圖片格式,可以為位圖,也可以為矢量圖# 我本來想輸出為jpg文件,但是在網(wǎng)頁中都是png格式(即調(diào)用writePNG),再轉(zhuǎn)換成別的圖像文件前,最好查一下是否支持else:page = doc[0]pm = page.getPixmap(matrix=trans, alpha=False)new_full_name = filename.split(".")[0]pm.writeImage(OUT_PATH+"%s.jpg" % new_full_name)print("%s轉(zhuǎn)換完成!" % filename)?
總結(jié)
以上是生活随笔為你收集整理的python PDF文件转JPG的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SpringMVC 数据的格式化、JSR
- 下一篇: 【Python】安装配置Anaconda