文章詳情頁

淺析Python 多行匹配模式

瀏覽：2日期：2022-07-16 13:14:06

問題

你正在試著使用正則表達式去匹配一大塊的文本，而你需要跨越多行去匹配。

解決方案

這個問題很典型的出現(xiàn)在當(dāng)你用點(.)去匹配任意字符的時候，忘記了點(.)不能匹配換行符的事實。比如，假設(shè)你想試著去匹配C語言分割的注釋：

>>> comment = re.compile(r’/*(.*?)*/’)>>> text1 = ’/* this is a comment */’>>> text2 = ’’’/* this is a... multiline comment */... ’’’>>>>>> comment.findall(text1)[’ this is a comment ’]>>> comment.findall(text2)[]>>>

為了修正這個問題，你可以修改模式字符串，增加對換行的支持。比如：

>>> comment = re.compile(r’/*((?:.|n)*?)*/’)>>> comment.findall(text2)[’ this is an multiline comment ’]>>>

在這個模式中，(?:.|n) 指定了一個非捕獲組(也就是它定義了一個僅僅用來做匹配，而不能通過單獨捕獲或者編號的組)。

討論

re.compile() 函數(shù)接受一個標志參數(shù)叫 re.DOTALL ，在這里非常有用。它可以讓正則表達式中的.匹配包括換行符在內(nèi)的任意字符。比如：

>>> comment = re.compile(r’/*(.*?)*/’, re.DOTALL)>>> comment.findall(text2)[’ this is an multiline comment ’]

對于簡單的情況使用 re.DOTALL 標記參數(shù)工作的很好，但是如果模式非常復(fù)雜或者是為了構(gòu)造字符串令牌而將多個模式合并起來(2.18節(jié)有詳細描述)，這時候使用這個標記參數(shù)就可能出現(xiàn)一些問題。如果讓你選擇的話，最好還是定義自己的正則表達式模式，這樣它可以在不需要額外的標記參數(shù)下也能工作的很好。

以上就是淺析Python 多行匹配模式的詳細內(nèi)容，更多關(guān)于Python 多行匹配模式的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

Python 編程

上一條：Python 解析簡單的XML數(shù)據(jù)下一條：Python圖像處理二值化方法實例匯總

相關(guān)文章：

1. asp批量添加修改刪除操作示例代碼2. ASP實現(xiàn)加法驗證碼3. PHP循環(huán)與分支知識點梳理4. 讀大數(shù)據(jù)量的XML文件的讀取問題5. 低版本IE正常運行HTML5+CSS3網(wǎng)站的3種解決方案6. ASP刪除img標簽的style屬性只保留src的正則函數(shù)7. JSP+Servlet實現(xiàn)文件上傳到服務(wù)器功能8. 解析原生JS getComputedStyle9. jsp+servlet實現(xiàn)猜數(shù)字游戲10. css代碼優(yōu)化的12個技巧

排行榜

					
					Docker容器如何更新打包并上傳到阿里云
django從后臺返回html代碼的實例
idea設(shè)置自動導(dǎo)入依賴的方法步驟
JetBrains IntelliJ IDEA 配置優(yōu)化技巧
Python實現(xiàn)GIF圖倒放
低版本IE正常運行HTML5+CSS3網(wǎng)站的3種解決方案
ASP.NET MVC使用異步Action的方法
解決SpringBoot打成jar運行后無法讀取resources里的文件問題
Django結(jié)合使用Scrapy爬取數(shù)據(jù)入庫的方法示例
PHP循環(huán)與分支知識點梳理
ASP刪除img標簽的style屬性只保留src的正則函數(shù)