python正则表达式中的转义字符_详解python中正则表达式的反斜线的转义功能
最近深入研讀了正則表達式的一本經典著作,對于在python中使用正則表達式時使用反斜線轉義功能時有些心得,特與大家分享。
核心思想:在python中使用正則表達式時要切記反斜線具有兩層轉義功能,如果你要匹配一個反斜線本身時要注意它必須被轉義兩次。(除非你使用原始字符串,就是字符串前面加r)
我們先來看一個例子:
import re
a = re.match('\\\','\\')
File "", line 2
a = re.match('\\\','\\')
^
SyntaxError: unexpected character after line continuation character
上面這個例子本身就不合語法要求,那么為什么呢? 首先在
python中,因為正則表達式本身是一個字符串,所以它要遵守字符串的規則——反斜線表示轉義符
而在正則表達式中反斜線又是一個具有轉義功能的元字符,所以反斜線具備了雙重轉義功能
回到例子中,第一個轉義了第二個,此時第二個去除了字符串轉義符的身份,但是它還有正則表達式轉義元字符的身份
也就是說第二個仍然具備轉義功能,那么它轉義誰呢?它只能轉義第三個,可是第三個它具備兩層身份(字符串的轉義符和正則表達式的轉義元字符)
所以現在有兩種可能情況發生:
第一種,第二個無法轉義第三個,因為身份不符,一個是正則表達式轉義元字符,另一個是字符串轉義符
第二種,第二個轉義了第三個,但是這種轉義也僅僅是去除了一層身份,但是它還有一層身分(轉義元字符)結果就是第三個仍然具有轉義功能。
總之不管這時發生了哪種情況,第三個最終結果就是仍然具備轉義功能,他會轉義它后面的單引號,使得整段代碼語法錯誤。
所以正確的寫法是再添加一個反斜線,四個反斜線,兩兩轉義之后最終轉義成匹配單獨一個反斜線的功能
import re
a = re.match('\\\\','\\')
print(a)
#顯示的結果match='\\',之所以顯示兩個反斜線是因為語法規定一個反斜線無法顯示(\是轉義符)
<_sre.SRE_Match object; span=(0, 1), match='\\'>
當然也可以使用原始字符串的方法,在字符串前面加r,這時里面的反斜線就失去字符串轉義符的功能了,本文主要討論實質原理,不是方法
import re
a = re.match(r'\\','\\')
print(a)
<_sre.SRE_Match object; span=(0, 1), match='\\'>
總結
以上是生活随笔為你收集整理的python正则表达式中的转义字符_详解python中正则表达式的反斜线的转义功能的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何将文件地址转为url_Node.js
- 下一篇: systemverilog硬件设计及建模