python获取docx文档的内容(文本)
生活随笔
收集整理的這篇文章主要介紹了
python获取docx文档的内容(文本)
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
首先下載第三方庫(kù)python-docx: pip install python-docx(在py文件里面導(dǎo)入的時(shí)候是import docx)
簡(jiǎn)單的說(shuō),docx里面的每一個(gè)段落都是一個(gè)paragraph對(duì)象,段落中文本如果有不同的樣式(加粗,斜體)就會(huì)有不同的run對(duì)象,而且paragraph和run對(duì)象都有一個(gè)text屬性,表示的是他包含的文本
import docxdef getText(filename):doc = docx.Document(filename)fullText = []for i in doc.paragraphs:#迭代docx文檔里面的每一個(gè)段落fullText.append(i.text)#保存每一個(gè)段落的文本return '\n'.join(fullText) def main():print getText('reviews.docx')#reviews.docx是我自己創(chuàng)建的一個(gè)文檔,注意要和你的py文件一個(gè)目錄下if __name__=="__main__":main()reviews.docx文件下載:https://pan.baidu.com/s/1pMEXSLl
總結(jié)
以上是生活随笔為你收集整理的python获取docx文档的内容(文本)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Python实现换位加密
- 下一篇: delphi程序crackme分析1