成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁(yè) > 知識(shí)庫(kù) > Python爬取你好李煥英豆瓣短評(píng)生成詞云的示例代碼

Python爬取你好李煥英豆瓣短評(píng)生成詞云的示例代碼

熱門(mén)標(biāo)簽:正安縣地圖標(biāo)注app 遼寧智能外呼系統(tǒng)需要多少錢(qián) 螳螂科技外呼系統(tǒng)怎么用 電銷(xiāo)機(jī)器人系統(tǒng)廠家鄭州 地圖地圖標(biāo)注有嘆號(hào) 400電話申請(qǐng)資格 舉辦過(guò)冬奧會(huì)的城市地圖標(biāo)注 qt百度地圖標(biāo)注 阿里電話機(jī)器人對(duì)話

爬取過(guò)程:

你好,李煥英 短評(píng)的URL:

https://movie.douban.com/subject/34841067/comments?start=20limit=20status=Psort=new_score

分析要爬取的URL;
34841067:電影ID
start=20:開(kāi)始頁(yè)面
limit=20:每頁(yè)評(píng)論條數(shù)

代碼:

url = 'https://movie.douban.com/subject/%s/comments?start=%slimit=20sort=new_scorestatus=P % (movie_id, (i - 1) * 20)

在谷歌瀏覽器中按F12進(jìn)入開(kāi)發(fā)者調(diào)試模式,查看源代碼,找到短評(píng)的代碼位置,查看位于哪個(gè)div,哪個(gè)標(biāo)簽下:

可以看到評(píng)論在div[id=‘comments']下的div[class=‘comment-item']中的第一個(gè)span[class=‘short']中,使用正則表達(dá)式提取短評(píng)內(nèi)容,即代碼為:

url = 'https://movie.douban.com/subject/%s/comments?start=%slimit=20sort=new_scorestatus=P' \

     % (movie_id, (i - 1) * 20)

   req = requests.get(url, headers=headers)
   req.encoding = 'utf-8'
   comments = re.findall('span class="short">(.*)/span>', req.text)

背景圖:

生成的詞云:

完整代碼:

import re
from PIL import Image
import requests
import jieba
import matplotlib.pyplot as plt
import numpy as np

from os import path

from wordcloud import WordCloud, STOPWORDS

headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:64.0) Gecko/20100101 Firefox/64.0'
}

d = path.dirname(__file__)

def spider_comment(movie_id, page):
 """
 爬取評(píng)論
 :param movie_id: 電影ID
 :param page: 爬取前N頁(yè)
 :return: 評(píng)論內(nèi)容
 """
 comment_list = []
 for i in range(page):
  url = 'https://movie.douban.com/subject/%s/comments?start=%slimit=20sort=new_scorestatus=Ppercent_type=' \

    % (movie_id, (i - 1) * 20)

  req = requests.get(url, headers=headers)
  req.encoding = 'utf-8'
  comment_list = re.findall('span class="short">(.*)/span>', req.text)


  print("當(dāng)前頁(yè)數(shù):%s,總評(píng)論數(shù):%s" % (i, len(comment_list)))

 return comment_list

def wordcloud(comment_list):

 wordlist = jieba.lcut(' '.join(comment_list))
 text = ' '.join(wordlist)

 print(text)

 # 調(diào)用包PIL中的open方法,讀取圖片文件,通過(guò)numpy中的array方法生成數(shù)組
 backgroud_Image = np.array(Image.open(path.join(d, "wordcloud.png")))

 wordcloud = WordCloud(
  font_path="simsun.ttc",
  background_color="white",

  mask=backgroud_Image, # 設(shè)置背景圖片
  stopwords=STOPWORDS,
  width=2852,
  height=2031,
  margin=2,
  max_words=6000, # 設(shè)置最大顯示的字?jǐn)?shù)
  #stopwords={'企業(yè)'}, # 設(shè)置停用詞,停用詞則不再詞云圖中表示
  max_font_size=250, # 設(shè)置字體最大值
  random_state=1, # 設(shè)置有多少種隨機(jī)生成狀態(tài),即有多少種配色方案
  scale=1) # 設(shè)置生成的詞云圖的大小

 # 傳入需畫(huà)詞云圖的文本
 wordcloud.generate(text)

 wordcloud.to_image()
 wordcloud.to_file("cloud.png")

 plt.imshow(wordcloud)
 plt.axis("off")
 plt.show()

# 主函數(shù)
if __name__ == '__main__':
 movie_id = '34841067'
 page = 11
 comment_list = spider_comment(movie_id, page)
 wordcloud(comment_list)

WordCloud各含義參數(shù)如下:

font_path : string #字體路徑,需要展現(xiàn)什么字體就把該字體路徑+后綴名寫(xiě)上,如:font_path = '黑體.ttf'

width : int (default=400) #輸出的畫(huà)布寬度,默認(rèn)為400像素

height : int (default=200) #輸出的畫(huà)布高度,默認(rèn)為200像素

prefer_horizontal : float (default=0.90) #詞語(yǔ)水平方向排版出現(xiàn)的頻率,默認(rèn) 0.9 (所以詞語(yǔ)垂直方向排版出現(xiàn)頻率為 0.1 )

mask : nd-array or None (default=None) #如果參數(shù)為空,則使用二維遮罩繪制詞云。如果 mask 非空,設(shè)置的寬高值將被忽略,遮罩形狀被 mask 取代。除全白(#FFFFFF)的部分將不會(huì)繪制,其余部分會(huì)用于繪制詞云。如:bg_pic = imread('讀取一張圖片.png'),背景圖片的畫(huà)布一定要設(shè)置為白色(#FFFFFF),然后顯示的形狀為不是白色的其他顏色??梢杂胮s工具將自己要顯示的形狀復(fù)制到一個(gè)純白色的畫(huà)布上再保存,就ok了。

scale : float (default=1) #按照比例進(jìn)行放大畫(huà)布,如設(shè)置為1.5,則長(zhǎng)和寬都是原來(lái)畫(huà)布的1.5倍

min_font_size : int (default=4) #顯示的最小的字體大小

font_step : int (default=1) #字體步長(zhǎng),如果步長(zhǎng)大于1,會(huì)加快運(yùn)算但是可能導(dǎo)致結(jié)果出現(xiàn)較大的誤差

max_words : number (default=200) #要顯示的詞的最大個(gè)數(shù)

stopwords : set of strings or None #設(shè)置需要屏蔽的詞,如果為空,則使用內(nèi)置的STOPWORDS

background_color : color value (default=”black”) #背景顏色,如background_color='white',背景顏色為白色

max_font_size : int or None (default=None) #顯示的最大的字體大小

mode : string (default=”RGB”) #當(dāng)參數(shù)為“RGBA”并且background_color不為空時(shí),背景為透明

relative_scaling : float (default=.5) #詞頻和字體大小的關(guān)聯(lián)性

color_func : callable, default=None #生成新顏色的函數(shù),如果為空,則使用 self.color_func

regexp : string or None (optional) #使用正則表達(dá)式分隔輸入的文本

collocations : bool, default=True #是否包括兩個(gè)詞的搭配

colormap : string or matplotlib colormap, default=”viridis” #給每個(gè)單詞隨機(jī)分配顏色,若指定color_func,則忽略該方法

random_state : int or None #為每個(gè)單詞返回一個(gè)PIL顏色


fit_words(frequencies) #根據(jù)詞頻生成詞云
generate(text) #根據(jù)文本生成詞云
generate_from_frequencies(frequencies[, ...]) #根據(jù)詞頻生成詞云
generate_from_text(text) #根據(jù)文本生成詞云
process_text(text) #將長(zhǎng)文本分詞并去除屏蔽詞(此處指英語(yǔ),中文分詞還是需要自己用別的庫(kù)先行實(shí)現(xiàn),使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) #對(duì)現(xiàn)有輸出重新著色。重新上色會(huì)比重新生成整個(gè)詞云快很多
to_array() #轉(zhuǎn)化為 numpy array
to_file(filename) #輸出到文件

到此這篇關(guān)于Python爬取你好李煥英豆瓣短評(píng)生成詞云的文章就介紹到這了,更多相關(guān)Python爬取豆瓣短評(píng)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • 教你如何用python爬取王者榮耀月收入流水線
  • python爬取企查查企業(yè)信息之selenium自動(dòng)模擬登錄企查查
  • python爬取梨視頻生活板塊最熱視頻
  • Python爬取動(dòng)態(tài)網(wǎng)頁(yè)中圖片的完整實(shí)例
  • python爬取之json、pickle與shelve庫(kù)的深入講解
  • python爬取股票最新數(shù)據(jù)并用excel繪制樹(shù)狀圖的示例
  • Python爬取酷狗MP3音頻的步驟
  • python爬取2021貓眼票房字體加密實(shí)例
  • 使用Python爬取小姐姐圖片(beautifulsoup法)
  • python爬蟲(chóng)之教你如何爬取地理數(shù)據(jù)

標(biāo)簽:淘寶好評(píng)回訪 昭通 合肥 隨州 阜新 信陽(yáng) 興安盟 濟(jì)源

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python爬取你好李煥英豆瓣短評(píng)生成詞云的示例代碼》,本文關(guān)鍵詞  Python,爬取,你好,李煥英,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python爬取你好李煥英豆瓣短評(píng)生成詞云的示例代碼》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于Python爬取你好李煥英豆瓣短評(píng)生成詞云的示例代碼的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    日韩一区二区三区电影在线观看| 国产精品成人播放| 日韩av资源| 51午夜精品视频| 国产中年熟女高潮大集合| 福利小视频在线| 日韩av一区在线观看| 亚洲视频在线免费| 黑人操亚洲人| av在线收看| 91精品国产亚洲| 国产a久久麻豆| 日韩午夜在线影院| 18以下岁禁止1000部免费| 福利所第一导航| 免费视频一区二区三区在线观看| 最近中文字幕mv2018在线高清| 亚洲一级一级97网| 欧美三级在线观看视频| 国内精品免费午夜毛片| 成人手机视频在线| 韩国成人动漫在线观看| 免费久久网站| 91麻豆国产在线| 五月天黄色网址| 精品久久免费视频| av在线免费观看网址| 日本韩国欧美中文字幕| kk眼镜猥琐国模调教系列一区二区| 久久久久久日产精品| 国产成人精品1024| 欧美v亚洲v综合v国产v仙踪林| 国产专区中文字幕| av无码一区二区三区| 日韩电影免费观看高清完整版在线观看| 久久天堂成人| 午夜国产精品理论片久久影院| 亚洲欧洲综合在线| 亚洲成人黄色在线观看| 亚洲一区图片| 国产精品久久久久久久久影视| 欧美区一区二区| 国产精品久久久久久久浪潮网站| 成人中文字幕视频| 亚洲国产精品无码av| 精品一卡二卡三卡四卡日本乱码| 成人欧美一区二区三区1314| 日韩欧美999| 狠狠干狠狠搞| 美女午夜精品| 在线视频你懂得| 97视频在线观看视频免费视频| **亚洲第一综合导航网站| 欧亚av在线| 亚洲欧美激情一区二区| 99精品视频在线播放免费| www国产黄色| 亚洲熟女www一区二区三区| 亚洲福利视频久久| 老牛嫩草一区二区三区日本| 999大胆视频| a天堂在线观看视频| 亚洲三级小视频| 五月天婷亚洲天综合网鲁鲁鲁| 亚洲精品免费网站| 久久视频社区| 日日摸夜夜爽人人添| 污网站在线观看视频| 97精品久久人人爽人人爽| 日韩av片在线免费观看| 在线亚洲国产精品网站| 日韩欧美国产精品综合嫩v| 日日狠狠久久| 亚洲最大福利视频网站| 九九精品久久| 欧美裸体在线版观看完整版| 一本一道波多野结衣一区二区| 每日更新在线观看av| 尤物99国产成人精品视频| 韩国三级日本三级少妇99| 国产精品综合激情| 青青草原国产视频| 亚洲国产精品中文| 风间由美中文字幕在线看视频国产欧美| 婷婷激情五月网| 欧美一区免费看| 99爱在线视频| 欧美激情一区二区三区免费观看| 免费欧美激情| 五月婷婷激情在线| 日本欧美久久久久免费播放网| 国产99在线 | 亚洲| 石原莉奈在线亚洲三区| 一本色道久久综合亚洲精品酒店| 亚洲不卡一区二区三区| 精品国产乱码久久久久久88av| 国产www视频| 护士精品一区二区三区| 亚洲电影天堂av| 日本免费网站视频| 尤物视频在线视频| 丰乳肥臀在线| 亚洲人一二三区| 色婷婷av国产精品| 伊人再见免费在线观看高清版| 国产真实乱偷精品视频| 黄污视频在线观看| 一本色道久久综合亚洲二区三区| 狠狠艹夜夜干| 超碰精品一区二区三区乱码| 亚洲无毛电影| 天堂一区二区三区| 91大片在线观看| 精品视频在线观看一区| 黄页网址大全在线观看| 你懂的网址一区二区三区| 亚洲国产综合视频| 九色精品蝌蚪| 成人黄色av免费在线观看| 成人a'v在线播放| 成人av网站在线| 在线观看成年人网站| 国产一区二区三区乱码| 国产成人午夜高潮毛片| 亚洲精品国产熟女久久久| 婷婷综合激情| 婷婷精品国产一区二区三区日韩| 亚洲第一激情av| 一区二区成人精品| 日本免费一区二区视频| 欧美风情在线观看| 羞羞影视羞羞在线| 亚洲精品视频久久久| 日本一区二区中文字幕| 一区二区三区国| 久久国产高清| 中文在线视频| 国产深夜男女无套内射| 国产欧美综合色| 性xxxxbbbb| 亚洲天堂777| 先锋影音av资源网| 国产美女在线免费观看| 中文字幕色婷婷在线视频| 欧美日韩国产精品综合| jizz久久精品永久免费| 国产精品探花一区二区在线观看| 在线观看色视频| 在线的色视频| 91麻豆精品国产自产在线观看一区| 一二三四国产精品| 国产剧情一区二区三区| 国产精品嫩草影视| 久精品国产欧美| 99精品视频在线观看播放| 综合在线视频| 久久久亚洲午夜电影| 中文字幕2018| 国产亚洲二区| 国产精品一区二区果冻传媒| 精品999在线观看| 国产中年熟女高潮大集合| 成 人 黄 色 小说网站 s色| 国产免费亚洲高清| 亚洲欧美国产日韩天堂区| 最新天堂资源在线资源| 怡红院在线播放| 久久久久久久久久一区| 1024亚洲| 影音先锋导航| 久久久久久久高潮| 精品久久久久久久久久岛国gif| 国产 欧美 日韩 在线| 九一国产精品| 欧美14一18处毛片| 懂色中文一区二区在线播放| 国产成人精品三级麻豆| 青青青青在线| jizzjizzjizz亚洲女| 影音先锋国产在线资源| 国产精品极品美女粉嫩高清在线| 91麻豆6部合集magnet| 亚洲毛片网站| 亚洲欧美日韩在线播放| 亚州av综合色区无码一区| 天堂成人免费av电影一区| 三上悠亚国产精品一区二区三区| 欧美 日韩 人妻 高清 中文| 久久成人国产精品| 欧美日韩中文字幕一区二区| 欧美香蕉爽爽人人爽| 7777狠狠狠琪琪电影| 日韩中文字幕一区| 国产免费一区二区三区在线观看| 国产日韩在线观看一区| a一区二区三区| 天堂入口网站| 欧美电影免费网站| 欧洲大片精品免费永久看nba| 国产福利91精品| 欧美性猛交99久久久久99| 日日欢夜夜爽一区| 久久久久久国产精品免费免费| 日韩精彩视频在线观看| 国产情侣久久久久aⅴ免费| 亚洲午夜精品久久久中文影院av| 久热中文字幕在线| 国产三级按摩推拿按摩| 最新日韩av在线| 亚洲三级网页| 成人久久一区二区| 黄网在线观看网址入口| 国产精品免费观看久久| 韩国三级电影在线观看婷婷| 久久久久久久中文字幕| av资源网在线观看| 咪咪网在线视频| 免费a级人成a大片在线观看| 91一区二区在线观看| 日韩乱码一区二区| 亚洲狠狠婷婷综合久久久久图片| 九色在线视频蝌蚪| 国产精品无码专区av免费播放| 2024亚洲男人天堂| 久久视频一区二区三区| 亚洲www在线观看| 欧美日韩美女一区二区| 中文字幕亚洲区| 欧美国产激情一区二区三区蜜月| 一区二区日韩视频| 91亚洲精品视频| 久久精品国产**网站演员| 亚洲九九视频| 国产自产2019最新不卡| 成人做爰66片免费看网站| 欧美成人精品三级网站| 午夜电影一区| 国产一区二区在线网站| 一区二区三区短视频| wwwav国产| 国产三级在线观看| 国产精品久久久久久久免费软件| 亚洲国产精品久久久男人的天堂| 夜夜嗨av一区二区三区| 高清成人在线观看| 成年人免费av| 99re91这里只有精品| 国模大尺度视频| 国产一级特黄a高潮片| 综合久草视频| 国产色产综合产在线视频| 少妇一级淫片免费放播放| 亚洲a∨无码无在线观看| 中文字幕一区二区三区人妻在线视频| 国模无码大尺度一区二区三区| 欧美福利在线| 777视频在线观看| 日韩欧美在线免费观看视频| 国产成人夜色高潮福利影视| 欧美日韩成人网| 国产午夜精品久久久久久久久| 亚洲天堂一二三| 含羞草激情视频| 91精品国自产| 91福利在线导航| 国产成人激情av| 性欧美xxx69hd高清| 国产精品一卡二卡在线观看| 欧美日韩一二三四五区| 国产伦精品一区二区三区高清版禁| 7777精品久久久大香线蕉小说| 国产日韩电影| 精品推荐国产麻豆剧传媒| 亚洲天堂av高清| 少妇高潮久久久久久潘金莲| 国模私拍在线观看| 给我看免费高清在线观看| 国产亚洲精品自在久久| 久久免费电影| 精品樱空桃一区二区三区| 成人精品视频99在线观看免费| 国产精品三区在线观看| 夜夜精品视频一区二区| 国产一区二区三区久久久| 欧美一级大片在线免费观看| 成人在线观看亚洲| 国产一区二区三区免费看| 99精品国产在热久久婷婷| 一本色道久久综合狠狠躁的推荐| 国产一区二区三区久久久| 久久久99久久精品女同性| 看全色黄大色大片免费久久久| 亚洲在线视频网站| 一级免费a一片| 人人妻人人爽人人澡人人精品| 成人豆花视频| 一区二区三区中文在线| 精品999成人| 日韩色在线观看| 91麻豆国产香蕉久久精品| 人人干人人插| 国产精品网红福利| 中文字幕日韩在线播放| 麻豆美女网站| av在线不卡观看| 日韩在线视频导航| 在线不卡一区二区| 毛片在线不卡| 天堂中文字幕在线| 日韩麻豆第一页| 色美美综合视频| 麻豆成人久久精品二区三区小说| 在线成人h网| 日韩国产欧美一区二区| 亚洲欧美资源在线| 日韩福利一区| 欧美日韩高清不卡| 国产在线观看精品一区| fc2ppv在线播放| 亚洲小少妇裸体bbw| 日韩视频在线观看一区二区| 日韩一区二区三区免费视频| 色噜噜狠狠狠综合欧洲色8| 国产成人av一区二区三区在线| 亚洲成人综合网站| 少妇**av毛片在线看| 亚洲综合精品四区| 国产一精品一av一免费爽爽|