re正则表达式匹配多行文本
生活随笔
收集整理的這篇文章主要介紹了
re正则表达式匹配多行文本
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
今天在寫一個簡單爬蟲,最后的文本提取部分,卻一直提不出想要的部分。
文本格式是這樣的
離文本最近的<p data-align="left">不固定,只能用上面的<div class="rich-content topic-richtext">來匹配,但是用我僅知道的re的一點皮毛re.findall('(.*?)',text)發現,一直匹配不到
查了半天,才意識到我的問題是,匹配多行文本,順利找到方法:
https://www.jianshu.com/p/ebb3694a2b80
re.compile()函數可接受一個有用的標記–re.DOTALL。這使得正則表達式中的句點(.)可以匹配所有的字符,也包括換行符
添加re.DOTALL,順利解決
comment = re.compile(r'(.*?)', flags=re.DOTALL)比起解決問題,更重要的是知道你在面臨什么問題
總結
以上是生活随笔為你收集整理的re正则表达式匹配多行文本的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python之路金角大王_Python
- 下一篇: DDS与DA