成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識庫 > 淺談Python中的正則表達(dá)式

淺談Python中的正則表達(dá)式

熱門標(biāo)簽:長春極信防封電銷卡批發(fā) 如何地圖標(biāo)注公司 電銷機(jī)器人錄音要學(xué)習(xí)什么 煙臺電話外呼營銷系統(tǒng) 上海正規(guī)的外呼系統(tǒng)最新報價 企業(yè)彩鈴地圖標(biāo)注 銀川電話機(jī)器人電話 外賣地址有什么地圖標(biāo)注 預(yù)覽式外呼系統(tǒng)

Python里的正則表達(dá)式

Python里的正則表達(dá)式,無需下載外部模塊,只需要引入自帶模塊:re

import re

官方re模塊文檔: https://docs.python.org/zh-cn/3.9/library/re.html

同時,Python的正則表達(dá)式是PCRE標(biāo)準(zhǔn)的,相較于廣泛應(yīng)用在Unix上的POSIX標(biāo)準(zhǔn),還是有些區(qū)別的(主要是簡化)

基本方法

觀察re源碼,其主要的接口方法有:

  • match(…):從字符串的起始位置匹配一個模式,如果無法匹配成功,則match()就返回none
  • fullmatch(…):是match函數(shù)的完全匹配(從字符串開頭到結(jié)尾)版本
  • search(…):掃描整個字符串并(默認(rèn))返回第一個成功的匹配
  • sub(…):用于替換字符串中的匹配項
  • subn(…):和sub(…)類似,但返回值多一個替換次數(shù)
  • split(…):分割字符串,返回列表形式f
  • indall(…):在字符串中找到正則表達(dá)式所匹配的所有子串,并返回一個列表形式,如果沒有找到匹配的,則返回空列表。finditer(…):和 findall 類似,在字符串中找到正則表達(dá)式所匹配的所有子串,并把它們作為一個迭代器返回
  • compile(…):用于編譯正則表達(dá)式,生成一個正則表達(dá)式( Pattern )對象,供 match() 和 search() 這兩個函數(shù)使用
  • purge(…):用于清除正則表達(dá)式緩存

其中,本文主要會介紹的方法為:match(...)search(...)、findall(...)spilt(...)。不過,方法都類似,會這些方法,剩下的也大同小異。

元字符與預(yù)定義字符集

我認(rèn)為,元字符算和預(yù)定義字符集是正則表達(dá)式的核心內(nèi)容了。

預(yù)定義字符集:

預(yù)定義字符 說明
\w 匹配下劃線“”或任何字母(a-zA-Z)與數(shù)字(0-9)等價于a-zA-Z0-9
\W 與\w相反,匹配特殊字符等價于**^a-zA-Z0-9_**
\s 匹配任意的空白字符,等價于**空格>\r\n\f\v**
\S 與\s相反,匹配任意非空白字符的字符,等價于**^\s**
\d 匹配任意數(shù)字,等價于0-9
\D 與\d相反,匹配任意非數(shù)字的字符,等價于**^\d**
\b 匹配單詞的邊界
\B 與\b相反,匹配不出現(xiàn)在單詞邊界的元素
\A 僅匹配字符串開頭,等價于^
\Z 僅匹配字符串結(jié)尾,等價于$

元字符:

元字符 說明
. 匹配任何一個字符(除換行符**\n**除外)
^ 脫字符,匹配行的開始
$ 美元符,匹配行的結(jié)束
| 連接多個可選元素,匹配表達(dá)式中出現(xiàn)的任意子項
[] 字符組,匹配其中的出現(xiàn)的任意一個字符
- 連字符,表示范圍,如“1-5”等價于“1、2、3、4、5”
? 匹配其前導(dǎo)元素0次或1次
* 匹配其前導(dǎo)元素0次或多次
+ 匹配其前導(dǎo)元素1次或多次
{n}/{m,n} 匹配其前導(dǎo)元素n次/匹配其前導(dǎo)元素m~n次
() 在模式中劃分出子模式,并保存子模式的匹配結(jié)果

一般來說,使用+、?*、{n}{n,}{n,m}時,即激活正則表達(dá)式的貪婪模式。可以在其后加入?來取消貪婪模式。

貪婪模式

一般來見,重復(fù)多次匹配就是貪婪模式,也就是盡可能匹配多個字符。

比如:

import re

lineOne = "Who is the Mintimate"
# 貪婪模式
print(re.findall(r'\w+',lineOne))
# 非貪婪模式
print(re.findall(r'\w',lineOne))
print(re.findall(r'\w+?',lineOne))

輸出:

['Who', 'is', 'the', 'Mintimate']
['W', 'h', 'o', 'i', 's', 't', 'h', 'e', 'M', 'i', 'n', 't', 'i', 'm', 'a', 't', 'e']
['W', 'h', 'o', 'i', 's', 't', 'h', 'e', 'M', 'i', 'n', 't', 'i', 'm', 'a', 't', 'e']

可以看到,使用**?**來激活非貪婪模式,基本是讓多次匹配無效化。

捕獲與非捕獲括號

之所以捕獲與非捕獲括號單獨出來講,其實是我當(dāng)時學(xué)習(xí)正則時候,這邊卡了很久。

  • 捕獲括號:()
  • 非捕獲括號:(?:)

捕獲括號其實就是代碼里的優(yōu)先級一樣,比如:

2*(2+3)=10

之所以,我們會先算2+3,是因為有**()的存在。正則里也是,如果存在()**,則會優(yōu)先捕獲()內(nèi)的內(nèi)容:

import re

lineOne = "Who is Mintimate?"
# 未使用捕獲括號
print(re.findall(r'Mintimate',lineOne))
# 使用捕獲括號
print(re.findall(r'M(intimate)',lineOne))
# 使用非捕獲括號
print(re.findall(r'M(?:intimate)',lineOne))

輸出結(jié)果:

['Mintimate']
['intimate']
['Mintimate']

而非捕獲括號主要與|同時使用:

import re

lineOne = "This is the Mintimate,not the Minimen?"
print(re.findall(r'M(?:intimate|inimen)',lineOne))

輸出結(jié)果:

['Mintimate', 'Minimen']

正則匹配(判斷目標(biāo)格式)

主要講解Python下的幾個方法使用方法。

match匹配

match(…)即:

re.match(pattern, string, flags=0)

參數(shù)的具體含義如下:

  • pattern:表示需要傳入的正則表達(dá)式。
  • string:表示待匹配的目標(biāo)文本。
  • flags:表示使用的匹配模式。如:是否區(qū)分大小寫,多行匹配等等。可省略,默認(rèn)為0

使用match進(jìn)行正則匹配,可以方便我們對字符串內(nèi)類型的判斷,如:是否為純數(shù)字或第一位數(shù)否為數(shù)字

import re

lineOne = "7704194"
lineTwo = "My UID in Tencent Community is:7704194"
print(re.match(r"\d", lineOne))
print(re.match(r"\d+", lineOne))
print("===")
print(re.match(r"\d", lineTwo))
print(re.match(r"\d+", lineTwo))

輸出結(jié)果:

re.Match object; span=(0, 1), match='7'>
re.Match object; span=(0, 7), match='7704194'>
===
None
None

其中,\d為匹配0-9的數(shù)字類型,而+是匹配出現(xiàn)1次或多次。

正則搜索(提取/分組字符)

正則搜索,常用的是search和findall方法了,方法體均一樣:

re.search(pattern, string, flags=0)
re.findall(pattern, string, flags=0)

search和march類似,均是匹配字符串內(nèi)容,不符合返回None。但是主要區(qū)別:

  • re.match() 從第一個字符開始找, 如果第一個字符就不匹配就返回None, 不繼續(xù)匹配. 用于判斷字符串開頭或整個字符串是否匹配,速度快。
  • re.search() 會整個字符串查找,直到找到一個匹配。

代碼中更形象:

import re

lineOne = "7704194"
lineTwo = "My UID in Tencent Community is:7704194"
# 使用match搜索純數(shù)字字符串
print(re.match(r"\d", lineOne))
# 使用search搜索純數(shù)字字符串
print(re.search(r"\d", lineOne))
# 使用match搜索復(fù)合字符串
print(re.match(r"\d", lineTwo))
# 使用search搜索復(fù)合字符串
print(re.search(r"\d", lineTwo))

其輸出結(jié)果:

re.Match object; span=(0, 1), match='7'>
re.Match object; span=(0, 1), match='7'>
None
re.Match object; span=(31, 32), match='7'>

而findall,在上match和search的前提下,進(jìn)一步封裝。相對于強(qiáng)化版的match和search

import re

lineOne = "7704194"
lineTwo = "My UID in Tencent Community is:7704194"
print(re.findall(r'\d',lineOne))
print(re.findall(r"\d",lineTwo))

輸出結(jié)果:

['7', '7', '0', '4', '1', '9', '4']
['7', '7', '0', '4', '1', '9', '4']

而如果你想完成提?。?/p>

print(re.findall(r"\d+",lineTwo))

輸出:

['7704194']

方便在數(shù)據(jù)處理時,快速提取連續(xù)數(shù)字╮( ̄▽ ̄"")╭。

操作實例

單單看文檔,總是不實際。這邊我演示幾個正則表達(dá)式的實例(我根據(jù)我自己使用環(huán)境所寫,可能在其他特殊環(huán)境有問題

URL去參

在寫爬蟲時候,有時候得到的URL是帶標(biāo)簽(#)或者Get請求(?id=*)的,但是有時候我們需要去除這些參數(shù),得到純凈的URL地址,這個時候可以用正則表達(dá)式:

lineOne = "https://www.mintimate.cn#mintimate"
lineTwo = "https://www.mintimate.cn?user=mintimate"
print(re.findall(r'https?://(?:[\w]|[/\.])*',lineOne))
print(re.findall(r'https?://(?:[\w]|[/\.])*',lineTwo))

效果:

['https://www.mintimate.cn']
['https://www.mintimate.cn']

這里主要的細(xì)節(jié):

  • https?:匹配http或https
  • (?😃:非捕獲括號,用于和后續(xù)|進(jìn)行配合

IPv4匹配

用正則匹配IPv4就比較復(fù)雜了,我是這樣寫的:

import re

lineOne = "192.168.1.1"
lineTwo="這不是IPv4嗷"
isIPv4=re.compile(r'((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})(\.((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})){3}')
print(isIPv4.search(lineOne))
print(isIPv4.search(lineTwo))

輸出結(jié)果為:

re.Match object; span=(0, 11), match='192.168.1.1'>
None

解釋一下:

  • 末尾的{3},代表前面(\.((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2}))重復(fù)三次匹配,
  • 而前面的((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})我們可以拆分為兩部分,(2(5[0-5]|[0-4]\d))和0-1?\d{1,2}:前者是匹配首位為2開頭、第二位為1到5或1到4、最后一位為0到9;后者是匹配第一位為0或1,且?代表可以不存在這一項,后兩位為兩位0-9的數(shù)字。

效率問題

使用正則表達(dá)式,很大程度是為了精簡代碼,但是存在一下問題:

  • 代碼可讀性降低:普通的匹配數(shù)字還好,但是如果都像IPv4這樣的,一定程度可讀性就降低了,維護(hù)成本高(雖然后期一般不回去改)
  • 解析時間長:這個還是要看具體代碼,但是總的來說:貪婪模式相比懶惰模式以及獨占模式有一個回溯過程,消耗資源會更多。

解決方案:

  • 一條正則表達(dá)式規(guī)則如果運(yùn)用上百次,可以使用compile()方法進(jìn)行預(yù)先加載。
  • 減少使用貪婪模式。

總結(jié)

正則表達(dá)式是一個很重要的工具,尤其是在Python數(shù)據(jù)處理時,能高效處理問題事件??赐赀@篇文章后,應(yīng)該對正則表達(dá)式不在陌生,感興趣可以自己寫個正則規(guī)則,如:強(qiáng)密碼判斷、IPv6的判斷等。

另外,因為篇幅所限,更多Python內(nèi)的細(xì)則,可以參考官方文檔:

https://docs.python.org/zh-cn/3.9/library/re.html

到此這篇關(guān)于淺談Python中的正則表達(dá)式的文章就介紹到這了,更多相關(guān)Python正則表達(dá)式內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python演示解答正則為什么是最強(qiáng)文本處理工具
  • 一篇文章帶你了解Python和Java的正則表達(dá)式對比
  • 一篇文章徹底搞懂python正則表達(dá)式
  • 超詳細(xì)講解python正則表達(dá)式
  • Python正則表達(dá)式保姆式教學(xué)詳細(xì)教程
  • 帶你精通Python正則表達(dá)式
  • Python正則表達(dá)式中的量詞符號與組問題小結(jié)
  • 一篇文章帶你了解python正則表達(dá)式的正確用法
  • Python正則表達(dá)式的應(yīng)用詳解
  • python正則表達(dá)式re.search()的基本使用教程
  • python正則表達(dá)式函數(shù)match()和search()的區(qū)別

標(biāo)簽:湖北 宜昌 西寧 佳木斯 珠海 盤錦 潮州 上饒

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《淺談Python中的正則表達(dá)式》,本文關(guān)鍵詞  淺談,Python,中的,正則,表達(dá)式,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《淺談Python中的正則表達(dá)式》相關(guān)的同類信息!
  • 本頁收集關(guān)于淺談Python中的正則表達(dá)式的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    男女视频在线看| 欧美日本三区| 欧美日韩高清不卡| 性一交一乱一伧国产女士spa| 国产精品主播直播| japanese色系久久精品| 亚洲一区二区天堂| 亚洲成人自拍| 日韩成人午夜影院| 精品无码人妻一区二区免费蜜桃| 91精品在线麻豆| 久久亚洲精品小早川怜子66| 国产一区二区三区久久久久久久久| 在线欧美一区| 久久综合九色九九| 麻豆精品国产传媒av| 国产尤物视频在线| 婷婷国产v国产偷v亚洲高清| 免费黄色片网站| 调教视频在线观看| 写真福利理论片在线播放| 超碰网在线观看| 亚洲精品一区二区18漫画| 青青青国产在线视频| 老司机免费视频久久| 久久精品一区二区三区不卡免费视频| 天堂在线视频中文网| 4444亚洲人成无码网在线观看| 无码h肉动漫在线观看| 日韩一区在线播放| 丰满人妻一区二区三区大胸| 日韩中文字幕综合| 欧美亚洲综合在线| 欧美深夜视频| 欧美大片网站| 亚洲精品一区二区网址| 在线观看中文av| 国产视频一区在线| 日韩成人手机在线| 国产一区二区精品福利地址| 精品中文字幕在线2019| 在线观看日韩欧美| 欧美1级日本1级| 日本色综合中文字幕| 全部孕妇毛片免费孕妇| 禁断一区二区三区在线| 国产视频二区| 成人影院一区二区三区| 亚洲女同女同女同女同女同69| 欧美韩日一区二区三区| 国产夫妻自拍av| 欧美三级电影网址| 日韩制服丝袜先锋影音| 午夜免费看毛片| 欧美大电影免费观看| 国产精品视频一区在线观看| 久久国产黄色片| av在线资源网| 人妻夜夜爽天天爽| 成人午夜激情片| 手机看片日韩av| 又黄又爽在线免费观看| 久久精品中文字幕一区二区三区| 成人在线视频观看| 欧美激情综合五月色丁香| 国产成人高清精品| 国产精品99久久久久久动医院| 成人在线观看黄色| heyzo在线| 精品久久中文字幕| 日本欧洲一区二区| 国产伦精品一区二区三区视频网站| 超碰激情在线| 国产视频1区2区| 少妇献身老头系列| 97在线免费观看| 日韩美女啊v在线免费观看| 日本www在线播放| 欧美成人h版在线观看| 蜜臀av无码一区二区三区| 青青草视频在线观看免费| 日本高清在线观看wwwww色| 亚洲激情在线视频| 亚洲女人天堂成人av在线| 天天爱天天操天天干| 成人在线免费观看网站| 欧美色蜜桃97| 超碰在线一区二区三区| 岛国视频午夜一区免费在线观看| 成人久久久久久久久| 国产高清在线| 欧美精品一区二区蜜桃| 日韩精品极品视频在线观看免费| 一二三区中文字幕| 在线观看不卡一区| 91美女福利视频高清| 日韩欧美一区二区三区久久| 国产素人在线观看| 一区二区在线观看视频在线观看| 久久精品一区二区免费播放| 中文在线免费视频| 影音先锋可以看的网站| 欧美色图片区| 国产黑丝在线视频| 亚洲精品国产高清久久伦理二区| 一本色道久久综合亚洲二区三区| 国产色无码精品视频国产| 成人av资源网址| 怡红院av在线| 成人毛片视频免费看| 国产一区二区三区精品欧美日韩一区二区三区| 一本久久知道综合久久| 成人影院在线播放| 亚洲乱码国产乱码精品精软件| 精品国产一区二区三区久久狼5月| 欧美亚洲另类在线观看| 日本一区二区三区电影免费观看| 日韩精品一区二区三区四区视频| 欧美free性| 日韩在线免费高清视频| 亚洲香蕉伊综合在人在线视看| 狠狠v欧美ⅴ日韩v亚洲v大胸| 亚洲精品va| 久久精品综合网| 九色视频在线观看| 中文字幕久久久av一区| 一区在线观看免费| 免费在线看v| 精品国产99久久久久久宅男i| 欧美午夜电影一区| а√最新版天堂中文在线| 午夜伦理在线| 香蕉视频在线网址| 男生和女生一起差差差视频| 国产精品女主播一区二区三区| 精品人妻大屁股白浆无码| 97在线中文字幕| 国产成人精品免费看视频| 欧美一级二级在线观看| 亚洲欧美中文日韩在线| 亚洲成人手机在线观看| 精品国产美女| 在线播放你懂的| 欧美人与物videos另类xxxxx| 日本成熟性欧美| 先锋影音男人站| 成人性生交大片免费看视频在线| 麻豆国产入口在线观看免费| 成人影院午夜久久影院| 日本77777| 一区二区三区四区电影| 欧美大胆成人| gogogo高清在线观看免费完整版| 欧美一级理论性理论a| 精品午夜av| 欧美三级视频| 波多野结衣亚洲一区二区| 乱人伦视频在线| 国产一区欧美二区| 成人在线免费观看视频网站| 精品久久亚洲| 久久久久无码国产精品一区李宗瑞| 亚洲制服丝袜在线| 国产精品进线69影院| 亚洲一区二区三区观看| 折磨小男生性器羞耻的故事| 亚洲欧美日韩国产成人| 黄色一级片国产| 都市激情亚洲一区| 同性恋视频网站资源| 亚洲影院在线播放| 免费无码国产v片在线观看| 国产精品青草久久久久福利99| www.国产精品| 欧美精品亚洲精品日韩精品| 狠狠做深爱婷婷综合一区| 国产成人精品网址| 日韩中文欧美在线| 8mav模特福利视频在线观看| 在线成人亚洲| 欧美孕妇孕交xxⅹ孕妇交| 色婷婷综合中文久久一本| 国产河南妇女毛片精品久久久| 国产女人被狂躁到高潮小说| 国产午夜亚洲精品一级在线| 国产91露脸中文字幕在线| se69色成人网wwwsex| 亚洲第一久久影院| 日一区二区三区| 在线国产99| 俺也去精品视频在线观看| 久久亚洲一区二区三区四区五区高| 日韩一区二区三区免费视频| 奇米色一区二区| 久久久久久久久久免费视频| 天天干在线视频论坛| 日韩高清欧美激情| 日本一区二区免费在线观看| 国产丝袜在线观看视频| 国产专区在线播放| 国产黄页在线观看| 国产一级黄色av| 亚洲综合中文网| 国产又粗又长免费视频| 国产视频精品视频| 久草国产在线视频| 黄色软件在线观看| 黄色小网站在线观看| 天天干天天玩天天操| 精品国模一区二区三区欧美| 亚洲调教欧美在线| 欧美高清在线精品一区| 欧美亚洲一区二区在线观看| www·91·com| 特级做a爱片免费69| 亚洲日本va午夜在线影院| 国产视频三区| 亚洲精品视频91| 欧美成在线观看| 日本少妇吞精囗交| 亚洲人成午夜免电影费观看| 不卡的av网站| 四虎影视永久免费在线观看一区二区三区| 在线视频尤物| 少妇高潮一区二区三区| 国产你懂的在线观看| 欧美国产一二三区| 大尺度做爰床戏呻吟舒畅| 亚洲免费看黄网站| 亚洲国产精品精华液2区45| 日韩激情在线| 色资源网在线观看| 天天插天天操| 亚洲精品久久久久久久久久久| 国产亚洲毛片在线| 国产精品一区二区三区乱码| 日本久久高清视频| 亚洲a v网站| 成人免费毛片嘿嘿连载视频…| 久久综合久久88| 成人黄色网址在线观看| 动漫一区二区| 老司机精品视频网| 亚洲第一视频网站| www 成人av com| 在线观看色网站| 狠狠色丁香婷婷综合久久片| 182tv在线播放| 日批视频免费播放| 在线视频一区二区免费| 亚洲高清不卡av| 亚洲一区二区三区观看| 国产精品视频在线观看免费| 色综合久久久久久久久久久| 国产精品日韩精品欧美在线| 成人精品一区二区三区电影免费| 好看的av在线| 男人操女人的视频网站| 99久久久国产精品无码网爆| 亚洲国产精品99久久| 大伊香蕉精品在线品播放| 日韩精品专区在线影院观看| 搞黄视频在线观看| 国产va免费精品观看精品| 成人性生交大片免费看中文视频| 亚洲一区在线观| 91精品国产一区二区三区香蕉| 成人影院午夜久久影院| 午夜高潮免费视频| 亚洲天堂2024| 欧美精品色视频| 日韩欧美高清一区| 日韩一二三区视频| 欧美日韩亚洲成人| 色老头一区二区三区| 国产成人av影院| 在线综合视频网站| av网站在线播放| 中文字幕精品在线| 国产精品久久久久久一区二区三区| 天天影视网天天综合色在线播放| 久久看人人爽人人| 99re6这里只有精品视频在线观看| 亚洲人妻一区二区三区| 亚洲国产精品999| 日韩精品www| 日韩欧美视频免费观看| 免费观看30秒视频久久| 日本成人福利| 国产奶水涨喷在线播放| 国模大尺度视频一区二区| 日韩精品久久久久久久酒店| 在线免费观看av网站| l8videosex性欧美69| 午夜dv内射一区二区| 欧美激情一区二区三区在线| 国产精品区一区二区三区| 国产精品裸体一区二区三区| 夜夜嗨av禁果av粉嫩avhd| 成人精品亚洲| 黄色影院在线播放| 日本xxxxxwwwww| 一区二区三欧美| 日韩毛片视频在线看| 亚洲视频一二| 国产精品国语对白| 91视频国产高清| 成人免费看黄网址| 伊人色综合网| www.日日夜夜| 中文字幕一区二区三区四区五区六区| 一区二区三区日本久久久| 一区二区三区欧洲区| 国产精品观看| 免费视频一区二区| 18av在线视频| heyzo欧美激情| 综合综合综合综合综合网| 不卡电影一区二区三区| 日日av拍夜夜添久久免费| 欧美日韩综合久久| 欧美一级欧美三级| 日韩精品极品在线观看播放免费视频| 成人3d动漫一区二区三区| 亚洲三级理论片| 亚洲熟女少妇一区二区| 黄色激情网址| 波多野结衣二区三区|