成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識(shí)庫(kù) > 讓你一文弄懂Pandas文本數(shù)據(jù)處理

讓你一文弄懂Pandas文本數(shù)據(jù)處理

熱門標(biāo)簽:百應(yīng)電話機(jī)器人總部 電梯新時(shí)達(dá)系統(tǒng)外呼顯示e 地圖標(biāo)注與注銷 成都呼叫中心外呼系統(tǒng)哪家強(qiáng) 南昌地圖標(biāo)注 旅游廁所地圖標(biāo)注怎么弄 西青語音電銷機(jī)器人哪家好 宿州電話機(jī)器人哪家好 無錫智能外呼系統(tǒng)好用嗎

前言

日常工作中我們經(jīng)常接觸到一些文本類信息,需要從文本中解析出數(shù)據(jù)信息,然后再進(jìn)行數(shù)據(jù)分析操作。

而對(duì)文本類信息進(jìn)行解析是一件比較頭禿的事情,好巧,Pandas剛好對(duì)這類文本數(shù)據(jù)有比較好的處理方法,那就讓我們來一起學(xué)一學(xué)吧!

1. 文本數(shù)據(jù)類型

在pandas中存儲(chǔ)文本數(shù)據(jù)有兩種方式:object 和 string。在pandas 1.0版本之前,object是唯一的文本類型,在一列數(shù)據(jù)中如果包含數(shù)值和文本等混合類型則一般也會(huì)默認(rèn)為object。在pandas 1.0 版本之后,新增了string文本類型,可以更好的支持字符串的處理。

1.1. 類型簡(jiǎn)介

默認(rèn)情況下,object仍然是文本數(shù)據(jù)默認(rèn)的類型

如果要采用string類型,我們可以通過dtype進(jìn)行指定

在Series 或 Dataframe被創(chuàng)建后,我們還可以通過astype進(jìn)行類型強(qiáng)制轉(zhuǎn)換

當(dāng)然,我們還有個(gè)df.convert_dtypes()方法可以進(jìn)行智能數(shù)據(jù)類型選擇

1.2. 類型差異

string和object在操作上有所不同。

對(duì)于sting來說,返回數(shù)字輸出的字符串訪問器方法將始終返回可為空的整數(shù)類型;對(duì)于object來說,是 int 或 float,具體取決于 NA 值的存在

對(duì)于string類型來說,返回布爾輸出的方法將返回一個(gè)可為空的布爾數(shù)據(jù)類型

2. 字符串方法

Series 和 Index 都有一些字符串處理方法,可以方便進(jìn)行操作,最重要的是,這些方法會(huì)自動(dòng)排除缺失/NA 值,我們可以通過str屬性訪問這些方法。

2.1. 文本格式

文本格式是對(duì)字符串文本進(jìn)行格式操作,比如轉(zhuǎn)換大小寫之類的

>>> s = pd.Series(
...     ["A", "B", "Aaba", "Baca", np.nan, "cat"],
...     dtype="string"
... )
>>> s.str.lower() # 轉(zhuǎn)小寫
0       a
1       b
2    aaba
3    baca
4    NA>
5     cat
dtype: string
>>> s.str.upper() # 轉(zhuǎn)大寫
0       A
1       B
2    AABA
3    BACA
4    NA>
5     CAT
dtype: string
>>> s.str.title() # 每個(gè)單詞大寫
0       A
1       B
2    Aaba
3    Baca
4    NA>
5     Cat
dtype: string
>>> s.str.capitalize() # 首字母大寫
0       A
1       B
2    Aaba
3    Baca
4    NA>
5     Cat
dtype: string
>>> s.str.swapcase() # 大小寫互換
0       a
1       b
2    aABA
3    bACA
4    NA>
5     CAT
dtype: string
>>> s.str.casefold() # 轉(zhuǎn)為小寫,支持其他語言
0       a
1       b
2    aaba
3    baca
4    NA>
5     cat
dtype: string

2.2. 文本對(duì)齊

文本對(duì)齊是指在文本顯示的時(shí)候按照一定的規(guī)則進(jìn)行對(duì)齊處理,比如左對(duì)齊、右對(duì)齊、居中等等

>>> s.str.center(10,fillchar='-') # 居中對(duì)齊,寬度為10,填充字符為'-'
0    ----A-----
1    ----B-----
2    ---Aaba---
3    ---Baca---
4          NA>
5    ---cat----
dtype: string
>>> s.str.ljust(10,fillchar='-') # 左對(duì)齊
0    A---------
1    B---------
2    Aaba------
3    Baca------
4          NA>
5    cat-------
dtype: string
>>> s.str.rjust(10,fillchar='-') # 右對(duì)齊
0    ---------A
1    ---------B
2    ------Aaba
3    ------Baca
4          NA>
5    -------cat
dtype: string
>>> s.str.pad(width=10, side='left', fillchar='-') # 指定寬度,填充字符對(duì)齊方式為 left,填充字符為'-'
0    ---------A
1    ---------B
2    ------Aaba
3    ------Baca
4          NA>
5    -------cat
dtype: string
>>> s.str.zfill(3) # 指定寬度3,不足則在前面添加0
0     00A
1     00B
2    Aaba
3    Baca
4    NA>
5     cat
dtype: string

2.3. 計(jì)數(shù)與編碼

文本計(jì)數(shù)與內(nèi)容編碼

>>> s.str.count("a") # 字符串中指定字母的數(shù)量
0       0
1       0
2       2
3       2
4    NA>
5       1
dtype: Int64
>>> s.str.len() # 字符串的長(zhǎng)度
0       1
1       1
2       4
3       4
4    NA>
5       3
dtype: Int64
>>> s.str.encode('utf-8') # 編碼
0       b'A'
1       b'B'
2    b'Aaba'
3    b'Baca'
4       NA>
5     b'cat'
dtype: object
>>> s.str.encode('utf-8').str.decode('utf-8') # 解碼
0       A
1       B
2    Aaba
3    Baca
4    NA>
5     cat
dtype: object    

2.4. 格式判斷

格式判斷就是對(duì)字符串進(jìn)行字符格式判斷,比如是不是數(shù)字,是不是字母,是不是小數(shù)等等

>>> s = pd.Series(
...     ["A", "B", "Aaba", 12, 5, np.nan, "cat"],
...     dtype="string"
... )
>>> s.str.isalpha() # 是否為字母
0     True
1     True
2     True
3    False
4    False
5     NA>
6     True
dtype: boolean
>>> s.str.isnumeric() # 是否為數(shù)字0-9
0    False
1    False
2    False
3     True
4     True
5     NA>
6    False
dtype: boolean
>>> s.str.isalnum() # 是否由數(shù)字或字母組成
0    True
1    True
2    True
3    True
4    True
5    NA>
6    True
dtype: boolean
>>> s.str.isdigit() # 是否為數(shù)字
0    False
1    False
2    False
3     True
4     True
5     NA>
6    False
dtype: boolean
>>> s.str.isdecimal() # 是否為小數(shù)
0    False
1    False
2    False
3     True
4     True
5     NA>
6    False
dtype: boolean
>>> s.str.isspace() # 是否為空格
0    False
1    False
2    False
3    False
4    False
5     NA>
6    False
dtype: boolean
>>> s.str.islower() # 是否為小寫
0    False
1    False
2    False
3    False
4    False
5     NA>
6     True
dtype: boolean
>>> s.str.isupper() # 是否為大寫
0     True
1     True
2    False
3    False
4    False
5     NA>
6    False
dtype: boolean
>>> s.str.istitle() # 是否為標(biāo)題格式
0     True
1     True
2     True
3    False
4    False
5     NA>
6    False
dtype: boolean

以上這些字符串的方法其實(shí)和python原生的字符串方法基本相同。

3. 文本高級(jí)操作

文本高級(jí)操作包含文本拆分、文本替換、文本拼接、文本匹配與文本提取等,學(xué)會(huì)這些操作技巧,我們基本上就可以完成常見的復(fù)雜文本信息處理與分析了。

3.1. 文本拆分

文本拆分類似excel里的數(shù)據(jù)分列操作,將文本內(nèi)容按照指定的字符進(jìn)行分隔,具體大家可以看下面案例。

方法split()返回的是一個(gè)列表

我們可以使用get 或 []符號(hào)訪問拆分列表中的元素

我們還可以將拆分后的列表展開,需要使用參數(shù)expand

同樣,我們可以限制分隔的次數(shù),默認(rèn)是從左開始(rsplit是從右到左),用到參數(shù)n

對(duì)于更復(fù)雜的拆分規(guī)格,我們可以在分隔符處傳入正則表達(dá)式

補(bǔ)充:像str.slice()切片選擇方法與str.partition()文本劃分方法都有類似效果,大家可以自定查閱官方文檔案例了解。

3.2. 文本替換

我們經(jīng)常在數(shù)據(jù)處理中用到替換功能,將指定的一些數(shù)據(jù)替換成我們想要替換的內(nèi)容。同樣,在處理文本數(shù)據(jù)替換的時(shí)候,str.repalce()也可以很好的滿足這一操作。

以上案例中,將regex參數(shù)設(shè)置為False就可以進(jìn)行字面替換而不是對(duì)每個(gè)字符進(jìn)行轉(zhuǎn)義;反之,則需要轉(zhuǎn)義,為正則替換。

此外,我們還可以正則表達(dá)式替換,比如下面這個(gè)例子中我們實(shí)現(xiàn)的是對(duì)文本數(shù)據(jù)中英文部分進(jìn)行倒序替換:

可能部分同學(xué)無法直觀的理解上面的正則案例,這里簡(jiǎn)單的拆解介紹下:

關(guān)于正則表達(dá)式的一些介紹,大家還可以參考此前推文《》進(jìn)行更多了解。

另外,我們還可以通過str.slice_replace()方法實(shí)現(xiàn)保留選定內(nèi)容,替換剩余內(nèi)容的操作:

補(bǔ)充:我們還可通過str.repeat()方法讓原有的文本內(nèi)容重復(fù),具體大家可以自行體驗(yàn)

3.3. 文本拼接

文本拼接是指將多個(gè)文本連接在一起,基于str.cat()方法

比如,將一個(gè)序列的內(nèi)容進(jìn)行拼接,默認(rèn)情況下會(huì)忽略缺失值,我們亦可指定缺失值

連接一個(gè)序列和另一個(gè)等長(zhǎng)的列表,默認(rèn)情況下如果有缺失值,則會(huì)導(dǎo)致結(jié)果中也有缺失值,不過可以通過指定缺失值na_rep的情況進(jìn)行處理

連接一個(gè)序列和另一個(gè)等長(zhǎng)的數(shù)組(索引一致)

索引對(duì)齊

在索引對(duì)齊中,我們還可以通過參數(shù)join來指定對(duì)齊形式,默認(rèn)為左對(duì)齊left,還有outer, inner, right

3.4. 文本匹配

文本匹配這里我們介紹查詢和包含判斷,分別用到str.findall()、str.find()str.contains()方法。

文本查詢str.findall()返回查詢到的值,str.find()返回匹配到的結(jié)果所在的位置(-1表示不存在)

文本包含,其實(shí)str.contain()常見于數(shù)據(jù)篩選中

此外,還有str.startwith()str.endwith()用于指定開頭還是結(jié)尾包含某字符的情況,而str.match()則可用于正則表達(dá)式匹配。

3.5. 文本提取

我們?cè)谌粘V薪?jīng)常遇到需要提取某序列文本中特定的字符串,這個(gè)時(shí)候采用str.extract()方法就可以很好的進(jìn)行處理,它是用正則表達(dá)式將文本中滿足要求的數(shù)據(jù)提取出來形成單獨(dú)的列。

比如下面這個(gè)案例,我們用正則表達(dá)式將文本分為兩部分,第一部分是字母a和b,第二部分匹配數(shù)字:

在上述案例中,expand參數(shù)為Fasle時(shí)如果返回結(jié)果是一列則為Series,否則是Dataframe。

我們還可以對(duì)提取的列進(jìn)行命令,形式如?P列名稱>,具體如下:

提取全部匹配項(xiàng),會(huì)將一個(gè)文本中所有符合規(guī)則的內(nèi)容匹配出來,最后形成一個(gè)多層索引數(shù)據(jù):

我們還可以從字符串列中提取虛擬變量,例如用"|"分隔(第一行abc只有a,第二行有a和b,第三行都沒有,第四行有a和c):

以上就是本次全部?jī)?nèi)容,相信大家在熟練這些文本數(shù)據(jù)處理的操作后,在日常工作中對(duì)于文本數(shù)據(jù)的處理將會(huì)非常得心應(yīng)手。

總結(jié)

到此這篇關(guān)于Pandas文本數(shù)據(jù)處理的文章就介紹到這了,更多相關(guān)Pandas文本數(shù)據(jù)處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python 數(shù)據(jù)處理庫(kù) pandas 入門教程基本操作
  • Pandas 數(shù)據(jù)處理,數(shù)據(jù)清洗詳解
  • pandas 空數(shù)據(jù)處理方法詳解
  • pandas數(shù)據(jù)處理進(jìn)階詳解

標(biāo)簽:贛州 雅安 渭南 西安 辛集 許昌 濰坊 七臺(tái)河

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《讓你一文弄懂Pandas文本數(shù)據(jù)處理》,本文關(guān)鍵詞  讓你,一文,弄懂,Pandas,文本,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《讓你一文弄懂Pandas文本數(shù)據(jù)處理》相關(guān)的同類信息!
  • 本頁收集關(guān)于讓你一文弄懂Pandas文本數(shù)據(jù)處理的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    日产精品一线二线三线芒果| 少妇一区二区三区| 日韩精品电影一区亚洲| 国精一区二区| 国产无遮挡在线观看| 亚洲视频观看| 欧美日韩精品综合在线| 日韩av图片| 中文字幕 日韩 欧美| 韩国欧美国产1区| 老司机深夜福利在线观看| jizz国产在线观看| 国产成人久久精品77777综合| 成人h在线播放| 五月国产精品| 99精品99| 久久久久久免费毛片精品| 精品少妇一区二区三区视频免付费| 成人小视频在线观看| 亚洲最新在线| 国产一区二区三区四区五区加勒比| 很很鲁在线视频播放影院| 国产激情视频一区二区三区| 国产激情在线观看视频| 性xxxx18| 九九综合九九综合| 黄色a**址| 爽爽爽爽爽爽爽成人免费观看| 久久综合九色| 特黄国产免费播放| 18网站在线观看| 潘金莲一级淫片aaaaa| 精品久久久久久中文字幕大豆网| 日日骚av一区二区| 蜜桃免费一区二区三区| 欧美日韩中文不卡| 91看片破解版| 欧美日韩亚洲综合一区二区三区激情在线| 国产成人亚洲欧美电影| 日韩精品福利在线| 亚洲欧美色综合| 国产精品久久久久久久久借妻| 久久久久久久久99| 日本少妇高清视频| 亚洲AV第二区国产精品| 91免费视频黄| 国产精品久久免费看| 另类小说第一页| 欧洲在线视频一区| 中文字幕亚洲欧美日韩| 亚洲人体一区| 欧美一级片免费播放| 巨大荫蒂视频欧美另类大| 看片一区二区| 国产伦精品一区二区三区在线播放| 欧美一级搡bbbb搡bbbb| 色视频www在线播放| 日韩片之四级片| 欧美精品亚洲精品| www.aqdy爱情电影网| 亚洲国产婷婷| 欧美激情一区二区三区| 99国产精品久久一区二区三区| 国产真乱mangent| 国产美女特级嫩嫩嫩bbb片| 好男人中文字幕官网| 天堂视频免费看| 日韩肉感妇bbwbbwbbw| 日本高清不卡视频| 中文字幕久热精品视频在线| 7777久久亚洲中文字幕| 在线丝袜欧美日韩制服| 高清国语自产拍免费一区二区三区| 久久九九久久九九| 欧美在线一卡| 在线看三级网站视频| 日韩色妇久久av| 国产视频手机在线播放| 99草草国产熟女视频在线| 2022国产精品视频| 日韩美女中文字幕| 大桥未久一区二区三区| 尤物视频最新网址| 久久在线视频精品| 深夜福利国产精品| 国产成人精品免费在线| 日韩a在线播放| 91tv亚洲精品香蕉国产一区| 色哟哟中文字幕| 日韩电影免费看| 国产最新精品免费| 精品99999| 九色自拍视频在线观看| 91精品在线播放| 无码人妻一区二区三区免费| 国产伦子伦对白视频| 亚洲成年人专区| 亚洲欧美日韩系列| 日本aⅴ免费视频一区二区三区| 日本高清视频网站| 日本丶国产丶欧美色综合| 蜜臀av一区二区在线观看| 国产精品久久久久久久av福利| 夜夜嗨av色一区二区不卡| 国产在线精品播放| 亚洲少妇中文字幕| 人成福利视频在线观看| 欧美aa免费在线| 亚洲av无码国产精品久久不卡| www.日韩系列| 欧美另类高清视频在线| 国产伦精品一区二区三区视频青涩| 日本一区二区高清不卡| 国产日韩免费视频| 国产传媒久久久| 国产精品一区二区不卡| freehdxxxx护士| 免费黄色电影在线观看| 日韩电影在线一区| www.性欧美| 影音先锋中文字幕影院| 国产精品一区二区三区毛片淫片| 久久香蕉国产| 亚洲网站视频在线观看| 一本—道久久a久久精品蜜桃| 欧美主播一区二区三区美女 久久精品人| 蜜桃av导航| 成全视频在线播放大地| 欧美日韩精品一区二区三区视频| 在线观看的网站你懂的| 外国成人直播| 亚洲精品97久久| 牛牛影视一区二区三区免费看| 五月婷婷久久久| 中文字幕成人在线视频| 亚洲一区在线视频观看| av成人黄色| 一夜七次郎国产精品亚洲| 国产麻豆午夜三级精品| 免费不卡视频| 欧性猛交ⅹxxx乱大交| 亚洲国产精品美女| 一区二区视频播放| 日韩一级片在线播放| 毛茸茸多毛bbb毛多视频| 爆操欧美孕妇| 欧美色欧美亚洲高清在线视频| 懂色av粉嫩av蜜臀av| 高潮一区二区三区乱码| 国产经典第一页| 国产精品腿扒开做爽爽爽挤奶网站| 日韩在线精品强乱中文字幕| 亚洲欧美日韩一级| 国产v日产∨综合v精品视频| 中文字幕乱码在线人视频| 日本aⅴ免费视频一区二区三区| 中文字幕一区二区在线观看| 秋霞午夜剧场| 精油按摩中文字幕久久| 国产亚洲精品va在线观看| 麻豆国产精品一区| 中文字幕第一页在线| 久操视频在线播放| 国产无限制自拍| 色综合久久66| 暧暧视频在线免费观看| 久久夜色精品亚洲噜噜国产mv| 你懂的视频在线观看资源| 99中文字幕| 成人国产网站| 国产日韩欧美一区二区三区乱码| 精品二区久久| 国产在线不卡一卡二卡三卡四卡| 亚洲视频日韩精品| 五月婷婷六月婷婷| 在线观看视频99| 国产伦精品一区二区三区视频小说| 午夜福利理论片在线观看| 国产视频在线看| 久草精品在线| 成人在线视频播放| 一区二区冒白浆视频| 亚洲插插视频| 尤物影院在线播放| 色综合中文网| 无码精品一区二区三区在线播放| 黄色小视频在线观看| av福利在线观看| 天天揉久久久久亚洲精品| 日本中文字幕电影在线免费观看| 国产成人a v| 蜜桃精品久久久久久久免费影院| 久久久久久久久久久久国产精品| 国产精品极品| 久久九九全国免费精品观看| 国产免费无遮挡吸奶头视频| 依人在线免费视频| 暖暖视频在线免费观看| 调教驯服丰满美艳麻麻在线视频| 中文字幕剧情在线观看一区| 日本一区二区久久精品| а√在线中文在线新版| 亚洲精品一区二区三区不| 麻豆精品一区二区三区| 性无码专区无码| 手机看片福利盒子久久| 欧美日韩亚洲在线| 老司机2019福利精品视频导航| 日韩人妻精品一区二区三区| 国产日韩精品视频一区| 欧美日韩国产色视频| 国产精品偷伦免费视频观看的| 天美av一区二区三区久久| 久久久久久久久97| 伊人久久久久久久久久久| 久久精品一区二区三区中文字幕| 国产精品成av人在线视午夜片| 波多野结衣在线观看一区| 亚洲在线播放| 在线电影一区| 福利影院在线看| 日本一级二级视频| 麻豆传媒视频在线观看免费| 国产美女精品久久久| www.夜夜操| 国产精品无码电影在线观看| 久久久五月天| 日日狠狠久久偷偷综合色| 亚洲美女黄色片| 欧美成人综合一区| 国产精品啪啪啪视频| 日本免费黄色小视频| 亚洲一区二区中文字幕在线观看| 成人av片在线观看| 中文字幕精品影院| 色噜噜狠狠色综合网| 国产成人h网站| 亚洲国产成人精品激情在线| 成人免费网站黄| 免费一级毛片在线观看| 欧美亚视频在线中文字幕免费| 九色porny视频在线观看| 不卡av中文字幕| 女人av一区| 热久久久久久久久| 久久草.com| 992tv在线| 精久久久久久| 大肉大捧一进一出好爽视频| 天天综合一区| 青青草在线观看视频| 在线播放国产一区| 高清国语自产拍免费一区二区三区| 亚洲AV无码精品自拍| 天天干天天综合| 一区二区三区小说| 色综合久久88色综合天天提莫| 岛国片免费看| 亚洲综合色视频| 欧美日韩综合| 青青操在线观看视频| 91成人在线观看喷潮教学| 22288色视频在线观看| 69av视频在线观看| 国产一级特黄a大片免费| 乱老熟女一区二区三区| 岛国一区二区三区高清视频| 老熟女高潮一区二区三区| 久9re热视频这里只有精品| 美女黄色片网站| 亚洲视频一区在线播放| 午夜精品小视频| 精品少妇爆乳无码av无码专区| 日韩精品一区三区| theporn国产精品| 亚洲成人在线视频播放| 黄色在线免费| 国产精品99久久不卡二区| 一级黄色短视频| 中文字幕有码视频| 国产高清av片| 天堂在线视频免费观看| 国产久一道中文一区| 欧美日韩国产一二| 国产麻豆一区二区三区精品视频| 91麻豆精品国产91久久久更新资源速度超快| 亚洲 欧美 日韩在线| 精品综合久久88少妇激情| 欧美一级大黄| 一本大道香蕉8中文在线视频| 国产精品视频免费观看| 欧美视频一区二区三区…| 熟妇人妻va精品中文字幕| 欧洲精品亚洲精品| 久久午夜夜伦鲁鲁一区二区| av污在线观看| 草美女在线观看| 精品国产不卡| 日本在线观看不卡| 强制捆绑调教一区二区| 中文字幕人成高清视频| 欧美日韩精品免费观看视频| 国产欧美一区二| 欧美日韩精品一区二区三区视频播放| 国产精品成人一区二区三区吃奶| 美媛馆国产精品一区二区| 91九色丨porny丨肉丝| 中文字幕一区二区三区免费视频| 亚洲私人影院| 五月天婷婷在线播放| 日本xxxxx18| www.久久热| 精品在线一区二区三区| 国产激情在线免费观看| 亚洲美女自拍偷拍| 久久婷婷麻豆| 国产日韩欧美夫妻视频在线观看| 亚洲av无码国产精品永久一区| 国产综合精品一区二区三区| 日韩av片子| 亚洲码国产岛国毛片在线| 国产视频在线免费观看| 成人激情免费网站| 日产精品久久久久久久性色| 精品综合久久久| 亚洲第一区第二区| 久久天天做天天爱综合色| 美女网站视频在线|