python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读
生活随笔
收集整理的這篇文章主要介紹了
python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
題前的話
pdf_path = "冉云飛.pdf"
pdf = pdfplumber.open(pdf_path)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)
engine.runAndWait()
engine = pyttsx3.init()
engine.say(open("冉云飛.txt","r").read())
engine.runAndWait()
之前有老師在群里推薦這個,我看了一眼覺得還是蠻有趣的,然后就忘了……昨天又看到這個《宅男福利!我50行Python代碼讓小姐姐給你讀Pdf》,今天于是開始自己嘗試,誰知道pdfplumber庫怎么也安裝不了,最后才明白原來是高版本不兼容庫文件,于是去python官網重新下了個3.7版本的,順利安裝pdfplumber庫成功。
海龜編輯器找不到這個庫文件,所以用的pip命令安裝,用python3.7編輯器運行。
pip install pdfplumber
參考程序:
import pdfplumberpdf_path = "冉云飛.pdf"
pdf = pdfplumber.open(pdf_path)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)
運行后的效果:
接下來設置語言朗讀,先安裝庫:
pip install pyttsx3
pip install pywin32?
#若未安裝pywin32, 需要安裝此庫的
然后加入朗讀代碼:
import pdfplumber #讀取PDF文字
pdf_path = "冉云飛.pdf"
pdf = pdfplumber.open(pdf_path)text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)
import pyttsx3 #朗讀代碼
engine = pyttsx3.init()
engine.say(text)engine.runAndWait()
運行后即可測試效果,代碼簡單,效果不錯。
如果是文本文件,代碼就更加簡單了:
import pyttsx3engine = pyttsx3.init()
engine.say(open("冉云飛.txt","r").read())
engine.runAndWait()
文本文件的內容:
相關文章:
Python相關的各類競賽及考級人工智能系列:人工智能|第六章baidu-aip應用體驗程序(四個)人工智能|Python調用百度人臉對比檢測體驗人工智能|Python一次進行多張照片的人臉比對總結
以上是生活随笔為你收集整理的python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 实现光晕效果_马自达6车灯升级激光四透镜
- 下一篇: mysql 主从_搭建mysql主从并编