成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識庫 > Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖

Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖

熱門標(biāo)簽:所得系統(tǒng)電梯怎樣主板設(shè)置外呼 小蘇云呼電話機(jī)器人 儋州電話機(jī)器人 北瀚ai電銷機(jī)器人官網(wǎng)手機(jī)版 市場上的電銷機(jī)器人 朝陽手機(jī)外呼系統(tǒng) 佛山400電話辦理 北京電銷外呼系統(tǒng)加盟 地圖標(biāo)注面積

一、前言

通過這篇文章,你將會收貨:

① 豆瓣電影數(shù)據(jù)的爬?。?/p>

② 手把手教你學(xué)會詞云圖的繪制;

二、豆瓣爬蟲步驟

當(dāng)然,豆瓣上面有很多其他的數(shù)據(jù),值得我們爬取后做分析。但是本文我們僅僅爬取評論信息。

待爬取網(wǎng)址:

https://movie.douban.com/subject/34913671/comments?status=P

由于只有一個字段,我們直接使用re正則表達(dá)式,解決該問題。

那些爬蟲小白看過來,這又是一個你們練手的好機(jī)會。

下面直接為大家講述爬蟲步驟:

# 1. 導(dǎo)入相關(guān)庫,用什么庫,都寫在這里
import requests
import chardet
import re

# 2. 構(gòu)造請求頭,這是一個反扒措施,初期學(xué)會總結(jié),哪些網(wǎng)站都用了哪些,總結(jié)多了,用起來就得心應(yīng)手。
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36',
    #在爬蟲里面如果出現(xiàn)了Referer最好也粘上去,因為有時候服務(wù)器會根據(jù)Referer來判斷請求時由瀏覽器還是爬蟲發(fā)出的
    'Referer':'https://www.douban.com/'
}

# 3. 這個循環(huán),類似于翻頁操作
for i in range(0,1001,20):
    url = f"https://movie.douban.com/subject/34913671/comments?start={i}limit=20status=Psort=new_score"
    # 4. 使用requests庫發(fā)起請求
    response = requests.get(url,headers=headers)#發(fā)起請求得到響應(yīng)
    # 5. 有時候返回結(jié)果可能會亂碼,這里記得調(diào)用encoding屬性,修改編碼
    response.encoding = "utf-8"
    # 6. 獲取返回的結(jié)果,調(diào)用的是text屬性。一定要區(qū)分text和content屬性的區(qū)別
    text = response.text#返回一個經(jīng)過解碼的字符串
    # 7. 解析數(shù)據(jù),這里直接使用正則解析
    comments_list = [i for i in re.findall('span class="short">(.*?)/span>',text,re.S)]
    # 8. 數(shù)據(jù)存儲,針對列表中的每一條數(shù)據(jù),我們直接使用open()函數(shù),寫入到txt文檔
    for comment in comments_list:
         with open(r"哆啦A夢:伴我同行2.txt","a",encoding = "utf-8") as f :  
                    f.write(comment + "\n")

三、最終效果如下

四、詞云圖制作流程

很多同學(xué)不會制作詞云圖,借此機(jī)會,我這里寫一套詳細(xì)的流程,大家照貓畫虎就行。

繪制詞云圖的詳細(xì)步驟如下:

  • ① 導(dǎo)入相關(guān)庫;
  • ② 讀取文本文件,使用jieba庫動態(tài)修改詞典;
  • ③ 使用jieba庫中的lcut()方法進(jìn)行分詞;
  • ④ 讀取停用詞,添加額外停用詞,并去除停用詞;
  • ⑤ 詞頻統(tǒng)計;
  • ⑥ 繪制詞云圖

① 導(dǎo)入相關(guān)庫

在這里,你需要什么庫,就導(dǎo)入什么庫。

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from imageio import imread

import warnings
warnings.filterwarnings("ignore")

② 讀取文本文件,使用jieba庫動態(tài)修改詞典

這里with open()讀取文本文件,我就不解釋了。這里解釋一下動態(tài)修改詞典。

sentence = "湖北廣水第三條街,有一條狗"

list(jieba.cut(sentence))

結(jié)果如下:

針對上述切分結(jié)果,如果我們想把“湖北廣水”和“第三條街”都當(dāng)成一個完整詞,而不切分開,怎么辦呢?此時,就需要借助add_word()方法,動態(tài)修改詞典。

sentence = "湖北廣水第三條街,有一條狗"

jieba.add_word("湖北廣水")
jieba.add_word("有一條狗")

list(jieba.cut(sentence))

結(jié)果如下:

總結(jié):

  • jieba.add_word()方法,只能一個個動態(tài)添加某個詞語。
  • 假如我們需要動態(tài)添加多個詞語的時候,就需要使用jieba.load_userdict()方法。也就是說:將所有的自定義詞語,放到一個文本中,然后使用該方法,一次性動態(tài)修改詞典集。

有了上述基礎(chǔ),我們直接讀取文本后,動態(tài)修改詞典。

with open(r"哆啦A夢:伴我同行2.txt",encoding="utf-8") as f:
    txt = f.read()
txt = txt.split()

jieba.add_word("哆啦A夢")
jieba.add_word("大雄")

③ 使用jieba庫中的lcut()方法進(jìn)行分詞

短短的一行代碼,很簡單。

data_cut = [jieba.lcut(x) for x in txt]

④ 讀取停用詞,添加額外停用詞,并去除停用詞

讀取停用詞,采用split()函數(shù)切分后,會得到一個停用詞列表。接著,采用+號將額外停用詞,添加到列表中即可。

# 讀取停用詞
with open(r"stoplist.txt",encoding="utf-8") as f:
    stop = f.read()
stop = stop.split()
# 額外添加停用詞,這里我們只添加了一個空格
stop = [" "] + stop
# 去除停用詞
s_data_cut = pd.Series(data_cut)
all_words_after = s_data_cut.apply(lambda x:[i for i in x if i not in stop])

⑤ 詞頻統(tǒng)計

這里注意series中value_counts()的使用。

all_words = []
for i in all_words_after:
    all_words.extend(i)
    
word_count = pd.Series(all_words).value_counts()

⑥ 繪制詞云圖

# 1、讀取背景圖片
back_picture = imread(r"aixin.jpg")

# 2、設(shè)置詞云參數(shù)
wc = WordCloud(font_path="simhei.ttf",
               background_color="white",
               max_words=2000,
               mask=back_picture,
               max_font_size=200,
               random_state=42
              )
wc2 = wc.fit_words(word_count)

# 3、繪制詞云圖
plt.figure(figsize=(16,8))
plt.imshow(wc2)
plt.axis("off")
plt.show()
wc.to_file("ciyun.png")

五、效果圖

從詞云圖大致可以看出:這又是一部催淚電影,這是一部情懷電影,陪伴我們長大的大雄都結(jié)婚了?那我們呢?其實(shí)我們小時候,就盼望著大雄和靜香能夠是好盆友,就在這部電影,他們結(jié)婚了。這部電影應(yīng)該怎么上演呢?大家可以去電影院一探究竟。

到此這篇關(guān)于Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖的文章就介紹到這了,更多相關(guān)Python爬取影評并生成詞云圖內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python多線程爬取豆瓣影評API接口
  • Python爬取英雄聯(lián)盟MSI直播間彈幕并生成詞云圖
  • Python通過文本和圖片生成詞云圖
  • 基于python生成英文版詞云圖代碼實(shí)例
  • Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例
  • python根據(jù)文本生成詞云圖代碼實(shí)例
  • 利用Python爬取微博數(shù)據(jù)生成詞云圖片實(shí)例代碼
  • Python采集貓眼兩萬條數(shù)據(jù) 對《無名之輩》影評進(jìn)行分析
  • 使用Python抓取豆瓣影評數(shù)據(jù)的方法
  • Python爬蟲實(shí)戰(zhàn):分析《戰(zhàn)狼2》豆瓣影評

標(biāo)簽:龍巖 云南 江蘇 商丘 金融催收 寧夏 定西 酒泉

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖》,本文關(guān)鍵詞  Python,爬取,哆啦,夢,伴我,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    日韩一区二区精品| 久久精品无码一区二区三区| 在线播放豆国产99亚洲| 久久久久久久一区二区| 欧美另类bbbxxxxx另类| 美女日韩在线中文字幕| 国产激情片在线观看| 好看的av在线不卡观看| 国产黄视频在线观看| 91精品国产综合久久久久久漫画| 日本丰满少妇裸体自慰| 久久久久亚洲av片无码下载蜜桃| 青草在线视频| 男女猛烈激情xx00免费视频| 天堂入口网站| 欧美激情中文网| 国产aⅴ超薄肉色丝袜交足| 成人午夜影视| 国产99久久久国产精品成人免费| 国产精品色眯眯| 国产h视频在线观看| 天天操夜夜操很很操| 欧美精品videosbestsex另类| 最近中文字幕在线6| 最近2019中文字幕一页二页| 999视频在线| 欧美性生交片4| 九九99九九精彩| 蜜桃日韩视频| 粉嫩在线一区二区三区视频| 一级片在线观看| 美女扒开尿口让男人操亚洲视频网站| 国产精品果冻传媒潘| 亚洲视频一区在线播放| 日本成人手机在线| av电影在线不卡| 国产综合色在线视频区| 国产精品美女www爽爽爽视频| 中文字幕欧美日韩久久| 写真福利片hd在线播放| 天堂中文在线免费观看| 国内成人精品一区| 久久成人在线视频| 亚洲精品小区久久久久久| 999日本视频| 久久亚洲国产精品成人av秋霞| 亚洲一区二区三区爽爽爽爽爽| 韩国中文字幕2020精品| 亚洲成年电人电影网站| 欧美理论片在线观看| 91精品久久久久久久久久不卡| 国产精品亚洲а∨天堂免在线| 国产精品久久一| 国产日韩欧美在线看| 久久久久亚洲| av在线免费网站| 亚洲欧美日韩国产精品| 日韩精品手机在线| 日韩在线观看视频一区| 欧美精品激情blacked18| 亚洲国产午夜| 成人三级毛片| 成人黄色大片在线免费观看| 国产夫妻在线视频| 可以在线观看的黄色| 在线观看私人影院w| 中文av一区二区| 亚洲午夜精品一区 二区 三区| 十八禁视频网站在线观看| 中文字幕一区二区免费| 在线观看免费国产视频| 国产亚洲欧洲997久久综合| 国产一区二区欧美| 五十路亲子中出在线观看| 国产成人在线视频网址| 久草在线资源网| 猫咪av永久| 日日骚久久av| 日韩欧美电影| 精品乱色一区二区中文字幕| 中文字幕日韩第一页| 精品午夜福利在线观看| 在线看一级片| 老鸭窝亚洲一区二区三区| 免费视频网站在线观看入口| 亚洲国产精品成人一区二区| 99久久99热这里只有精品| 亚洲国产精品热久久| 亚洲精品国产无天堂网2021| 美女不穿衣服的网站| 精品999在线播放| 久草视频免费在线播放| 一区不卡视频| 欧美成人精品在线播放| 男人与禽猛交狂配| 亚洲欧美韩国综合色| 99视频在线观看一区三区| 成人午夜剧场视频网站| 午夜精品久久久久久久| 中文字幕在线观看免费视频| 91精品国产91久久久久久| 日韩精品一区二区亚洲av| 美女网站色91| 日韩欧美大片| 青草全福视在线| www日本视频| 麻豆短视频在线观看| 丁香高清在线观看完整电影视频| 性生交大片免费全黄| 亚洲国产欧美日韩精品| sm在线播放| 国产精品久久久久久久久久| 天天人人精品| 亚洲综合第一页| 成年人视频网站免费观看| 在线欧美不卡| √天堂资源中文www| 精品视频高潮| 欧美爱爱免费视频| 69影院欧美专区视频| 久热国产精品| 野外性xxxxfreexxxxx欧美| 国产伦精品一区二区三区妓女下载| 国产精品第七页| 欧美卡1卡2卡| 国产欧美一区二区三区精品酒店| 亚洲精品中文字幕| 精品国产91| 一道本在线观看| 久久久久亚洲精品| 制服.丝袜.亚洲.中文.综合懂色| 欧美亚洲激情在线| 午夜精品视频一区二区三区在线看| 可以看美女隐私的网站| 成人久久在线| 欧美不卡一区二区| 欧美成人久久久免费播放| 久久www免费人成看片高清| 国产日韩欧美91| 成av人片一区二区| 中文字幕人成高清视频| 五月婷婷免费视频| 中文字幕a在线观看| 鲁丝一区二区三区| 中文字幕av在线| 黑人玩欧美人三根一起进| 欧美日韩免费高清| 91精品国产福利在线观看| 久久久9色精品国产一区二区三区| av电影高清在线观看| 欧美视频二区欧美影视| av男人的天堂网| 欧美一区二区公司| 91亚洲精品一区二区乱码| 天天干天天干天天干天天干天天干| 久久久久9999| 五月婷婷之婷婷| 激情视频在线观看一区二区三区| 亚洲一区二区三区日本久久九| 在线观看精品视频看看播放| 日韩电影网在线| 日韩五码在线| aaa在线视频| 美女一区二区三区视频| 久久99久久久久久久久久久| 韩国精品在线观看| 激情文学综合插| 精品久久久久久久人人人人传媒| 99久久自偷自偷国产精品不卡| 在线精品亚洲一区二区不卡| 深夜福利视频在线免费观看| 精品福利视频导航大全| 91 在线视频观看| 亚洲不卡在线观看| 26uuu成人网一区二区三区| 黄色资源在线看| 亚洲色图狠狠干| 日韩成人激情视频| av网站免费线看精品| 92久久精品一区二区| 日韩精品一级中文字幕精品视频免费观看| 动漫精品视频| 久草视频观看| 久久人人爽人人爽人人片av高清| 欧美在线视频在线播放完整版免费观看| 国产香蕉视频在线| 一区二区三区四区欧美| 黑人巨大精品欧美一区免费视频| 116美女写真午夜一级久久| 精品一区二区在线看| 精品久久久久中文慕人妻| 影音先锋亚洲精品| 精品福利视频导航| 欧美日韩高清在线| 免费特级黄毛片| 日本少妇性生活| 国产精品50p| 国产不卡视频| 天堂在线免费av| 欧美精品色哟哟| 2025韩国大尺度电影| 91www成人久久| 91精品国产91久久久久| 日本一区二区视频在线观看| 一级黄色片在线免费观看| 日韩av成人在线观看| 毛片无码国产| 最新在线中文字幕| 国产在线电影| 欧美影院在线播放| 国产三级在线播放| 日本aⅴ免费视频一区二区三区| 欧美日韩另类国产亚洲欧美一级| 免费网站永久免费观看| 国产精品麻豆| 小说区图片区亚洲| 国产系列电影在线播放网址| 九九精品视频在线| 欧美特黄一区| 欧美9999| 国产乱人伦真实精品视频| 免费91麻豆精品国产自产在线观看| 四虎电影院在线观看| 亚洲免费在线播放| 日日噜噜噜噜夜夜爽亚洲精品| 日韩美女免费视频| 亚洲综合另类| 欧美丰满熟妇xxxxx| 国产高清在线a视频大全| 精品国内自产拍在线观看视频| 亚洲视频sss| 国产高清不卡av| 国产在线播放不卡| 美女福利视频在线| 日韩在线播放av| 操她视频在线观看| 91久久影院| 捆绑凌虐一区二区三区| 成人av动漫在线| 国产成人精品视频ⅴa片软件竹菊| 久久av无码精品人妻系列试探| 五福影院新址进入www1378| 亚洲av无码国产精品久久不卡| 国产亚洲欧美另类中文| 精品久久久一区| 国产在线精品一区免费香蕉| а√天堂8资源在线官网| 亚洲熟女乱综合一区二区三区| 色琪琪丁香婷婷综合久久| 综合综合综合综合综合网| 亚洲va天堂va国产va久| 日韩一区二区精品视频| 飘雪影院手机免费高清版在线观看| 久久久免费人体| 亚洲最大av在线| 日本精品在线中文字幕| 日韩av自拍偷拍| 欧洲美女7788成人免费视频| 欧美少妇bbw| 一本色道久久加勒比精品| 中文字幕无线精品亚洲乱码一区| 在线免费观看电影网站入口| 国产精品qvod| 大j8黑人w巨大888a片| 欧洲生活片亚洲生活在线观看| 亚洲成人直播| 日韩国产欧美视频| 97精品人妻一区二区三区蜜桃| 人成免费电影一二三区在线观看| 国模精品视频| 一区二区在线观看免费视频| 久草福利资源站| 亚洲大胆人体大胆做受1| 国产精品suv一区二区88| 国产高清久久久久| 欧美亚洲日本精品| 日韩一区二区三区av| 国产精品边吃奶边做爽| www视频完整版| 中文 欧美 日韩| 91av影院| 亚洲欧美另类久久久精品2019| 中文字幕一区二区三区久久网站| free性护士videos欧美| 亚洲欧美在线视频| 日韩美女视频网站| 国产aⅴ精品一区二区三区黄| h七七www色午夜日本| 欧美午夜一区| 18禁男女爽爽爽午夜网站免费| 97人人在线视频| 91麻豆免费视频| 久久丝袜美腿综合| 狠狠爱www人成狠狠爱综合网| 欧美一级日韩免费不卡| 久久精品72免费观看| 国产aⅴ精品一区二区四区| 日韩精品在线视频免费观看| 欧美成人福利视频| 中文字幕日韩精品一区二区| 中文字幕精品久久久久| 国产欧美日韩一区二区三区在线| 国产九九视频一区二区三区| 国产欧美日韩91| 日本黄色的视频| 亚洲日本护士毛茸茸| 日本在线观看大片免费视频| 国产精品99一区二区| 日本成人黄色网址| 日韩午夜在线播放| 最近2018年中文字幕在线| 国产真实的和子乱拍在线观看| 国产日韩欧美久久| 欧美激情第四页| 你微笑时很美电视剧整集高清不卡| 在线视频中文字幕久| 国产亚洲欧美在线| 日本韩国精品一区二区在线观看| 第一站视频久草网| 麻豆亚洲av成人无码久久精品| 国产精东传媒成人av电影| 少妇激情av一区二区| 亚洲精品自产拍在线观看| 亚洲国产黄色片| 日本最新高清不卡中文字幕| 岛国一区二区在线观看| 欧美日韩免费高清一区色橹橹| 免费国产成人av|