成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁(yè) > 知識(shí)庫(kù) > python 爬取騰訊視頻評(píng)論的實(shí)現(xiàn)步驟

python 爬取騰訊視頻評(píng)論的實(shí)現(xiàn)步驟

熱門(mén)標(biāo)簽:申請(qǐng)辦個(gè)400電話號(hào)碼 400電話辦理費(fèi)用收費(fèi) 高德地圖標(biāo)注字母 深圳網(wǎng)絡(luò)外呼系統(tǒng)代理商 騰訊地圖標(biāo)注有什么版本 外呼系統(tǒng)前面有錄音播放嗎 千呼ai電話機(jī)器人免費(fèi) 鎮(zhèn)江人工外呼系統(tǒng)供應(yīng)商 柳州正規(guī)電銷(xiāo)機(jī)器人收費(fèi)

一、網(wǎng)址分析

查閱了網(wǎng)上的大部分資料,大概都是通過(guò)抓包獲取。但是抓包有點(diǎn)麻煩,嘗試了F12,也可以獲取到評(píng)論。以電視劇《在一起》為例子。評(píng)論最底端有個(gè)查看更多評(píng)論猜測(cè)過(guò)去應(yīng)該是 Ajax 的異步加載。
網(wǎng)上的大部分都是構(gòu)建評(píng)論的網(wǎng)址,通過(guò) requests 獲取,正則表達(dá)式進(jìn)行數(shù)據(jù)處理。本文也利用該方法進(jìn)行數(shù)據(jù)處理,其實(shí)利用 scrapy 會(huì)更簡(jiǎn)單。
根據(jù)前輩給出的經(jīng)驗(yàn),順利找到了評(píng)論所在的鏈接。

在新標(biāo)簽中打開(kāi),該網(wǎng)址的鏈接。

評(píng)論都在"content":"xxxxx"里面,所有可以通過(guò)正則表達(dá)式獲取。
那么現(xiàn)在要開(kāi)始構(gòu)建網(wǎng)址,找到其規(guī)律。
在查找評(píng)論鏈接的過(guò)程中無(wú)意發(fā)現(xiàn),點(diǎn)擊影評(píng)旁邊的評(píng)論總數(shù),可以獲取到更為干凈的評(píng)論界面。結(jié)果是一樣的。

既然是要爬取所有的評(píng)論,所以知道評(píng)論數(shù)是必不可少的。

再通過(guò)F12獲取到評(píng)論鏈接,找到網(wǎng)址的規(guī)律,構(gòu)建網(wǎng)址,加載三四個(gè)評(píng)論就行了。這里加載了四個(gè)網(wǎng)址。把所有網(wǎng)址復(fù)制到文本文件中,進(jìn)行對(duì)比分析。

觀察發(fā)現(xiàn)只有 cursor 和 source 進(jìn)行了改變,其他是不變的,二 source 是在第一個(gè)的基礎(chǔ)上進(jìn)行加一操作,所以只需要獲取到 cursor 即可。我們打開(kāi)一個(gè)評(píng)論鏈接的網(wǎng)址,我們可以知道,cursor 其實(shí)是上一頁(yè) 最后一個(gè)用戶(hù)的ID碼。所以我們只需要在爬取上一頁(yè)的時(shí)候一起爬蟲(chóng)了。然后就可以構(gòu)建網(wǎng)址。

二、代碼編寫(xiě)

這個(gè)代碼還是簡(jiǎn)單的。套用之前上課做的模板就可以直接進(jìn)行爬蟲(chóng)了。
通過(guò)正則表達(dá)式獲取評(píng)論,返回一個(gè)列表;
正則表達(dá)式獲得的 cursor 碼是列表,所以要轉(zhuǎn)化為字符串使用;
source 很簡(jiǎn)單了,直接在上一個(gè)的基礎(chǔ)上加一即可。

def getComment(html): # 爬取單頁(yè)評(píng)論

 findeComment = re.compile(r'"content":"(.*?)"', re.S)
 comment = re.findall(findeComment, html)
 # print(comment)
 return comment

def getCursor(html): # 獲取下一頁(yè)的cursor碼
 findeCursor = re.compile(r'"last":"(.*?)"', re.S)
 cursor = re.findall(findeCursor, html)[0]
 # print(cursor)
 return cursor


def getSource(source): # 獲取下一頁(yè)的source碼
 source = int(source) + 1
 return str(source)

有點(diǎn)難度的可能就送弄代理吧,但是代理可以模仿網(wǎng)上其他人的寫(xiě)法,所以還是不是很難。

#添加用戶(hù)代理

def ua(uapools):
 thisua = random.choice(uapools)
 # print(thisua)
 headers = ("User-Agent", thisua)
 opener = urllib.request.build_opener()
 opener.addheaders = [headers]
 # 設(shè)置為全局變量
 urllib.request.install_opener(opener)

三、遇到的問(wèn)題

1. 獲取評(píng)論的時(shí)候也將子評(píng)論爬蟲(chóng)進(jìn)去了。

仔細(xì)查看了源碼,發(fā)現(xiàn)評(píng)論主要在 data 下面的 oriCommList 列表里,其他范圍的評(píng)論為子評(píng)論。個(gè)人認(rèn)為子評(píng)論也算有效評(píng)論,目前不打算處理。

2. 獲取全部評(píng)論數(shù),直接通過(guò) requests 獲取不到

嘗試了 xpath 和 requests 發(fā)現(xiàn)不能獲取全部評(píng)論數(shù),所以目前只能通過(guò) selenium 獲取,但是 selenium 效率太低了,就獲取一個(gè)評(píng)論總數(shù),還不如打開(kāi)源碼直接修改評(píng)論總數(shù),所以暫時(shí)沒(méi)有修改

3. 評(píng)論總數(shù)數(shù)據(jù)太大

因?yàn)橹芭老x(chóng)過(guò)很多網(wǎng)站,同一個(gè) user-agent 很容易被 ban ,所以目前構(gòu)建了用戶(hù)代理,然后進(jìn)行隨機(jī)。其實(shí)還想加一個(gè) ip 代理的,但是使用了 ip 代理的網(wǎng)址,上面寫(xiě)的正常的 ip ,在使用的時(shí)候,拒絕連接。也嘗試過(guò)構(gòu)建代理池。但是代理池一般都是使用docker 和 Redis 進(jìn)行獲取。暫時(shí)沒(méi)有選用,之選用了用戶(hù)代理,然后在獲取 headers 的時(shí)候加個(gè) time.sleep(1)。目前還是正常的。

4. 報(bào)錯(cuò)'utf-8' codec can't decode byte 0xff in position 1: invalid start byte

遇到這個(gè)問(wèn)題,實(shí)在無(wú)語(yǔ),我懷疑后面的評(píng)論是新出的 emjoy,然后utf-8不能識(shí)別,程序掛掉了。但是選取其他格式,在解釋的過(guò)程估計(jì)還會(huì)掛掉,就暫時(shí)爬到1萬(wàn)條吧。

四、完整代碼

代碼倉(cāng)庫(kù)

以上就是python 爬取騰訊視頻評(píng)論的實(shí)現(xiàn)步驟的詳細(xì)內(nèi)容,更多關(guān)于python 爬取騰訊視頻評(píng)論的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • Python爬取騰訊視頻評(píng)論的思路詳解
  • 使用python實(shí)現(xiàn)抓取騰訊視頻所有電影的爬蟲(chóng)
  • 基于python實(shí)現(xiàn)的抓取騰訊視頻所有電影的爬蟲(chóng)
  • Python爬蟲(chóng)小練習(xí)之爬取并分析騰訊視頻m3u8格式

標(biāo)簽:烏蘭察布 平頂山 海南 哈爾濱 烏蘭察布 合肥 大慶 郴州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python 爬取騰訊視頻評(píng)論的實(shí)現(xiàn)步驟》,本文關(guān)鍵詞  python,爬取,騰訊,視頻,評(píng)論,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《python 爬取騰訊視頻評(píng)論的實(shí)現(xiàn)步驟》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于python 爬取騰訊視頻評(píng)論的實(shí)現(xiàn)步驟的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    国产精品zjzjzj在线观看| 日韩av高清在线观看| 欧美日韩一道本| 国产精品一国产精品最新章节| av在线私库| 日本久久久久久久久| 337p粉嫩大胆色噜噜噜噜亚洲| 欧美激情视频在线观看| 四虎影视亚洲| 精品第一国产综合精品aⅴ| 欧美肥妇bbwbbw| 日日av拍夜夜添久久免费| 菠萝蜜影院一区二区免费| 91福利视频导航| 我家有个日本女人| 欧美亚洲成人精品| 93在线视频精品免费观看| av中文字幕免费| 日韩电影毛片| 国产在线不卡av| 欧美一区2区视频在线观看| 日韩一级毛片| 日本视频久久久| www.com操| 97超碰人人看人人| 999在线观看免费大全电视剧| av动漫在线观看| 高潮在线视频| 非洲黑人最猛性xxxx交| 国产精品视频xxxx| 国产成年人在线观看| 欧美zozo| xfplay资源站色先锋在线观看| 久久精品免费| 久久久久国产精品厨房| 亚洲精品国产一区二区| 女人18毛片一区二区三区| 456国产精品| 99精品国产在热久久婷婷| 先锋影音av中文资源| 韩国毛片一区二区三区| 翔田千里一区二在线观看| 狠狠噜天天噜日日噜| 亚洲精品7777xxxx青睐| 亚洲亚洲人成综合网络| 三区四区电影在线观看| 国产成人精品网| 小鲜肉gaygays免费动漫| 欧美gay1069大粗吊| 菠萝菠萝蜜在线视频免费观看| 欧美色窝79yyyycom| 亚欧美无遮挡hd高清在线视频| 亚洲女人视频| 亚洲综合视频| 欧美日韩一区二区三区在线免费观看| 丁香综合五月| www视频免费| 久久久99免费| 精品激情国产视频| 欧美一区二区三区精品| 中文字幕一区二区三区人妻电影| 荫蒂被男人添免费视频| 老牛国产精品一区的观看方式| 久久躁日日躁aaaaxxxx| 国产精品久久久久久免费免熟| 九七影院理伦片| 亚洲1卡2卡3卡4卡乱码精品| 苍井空浴缸大战猛男120分钟| 女人抽搐喷水高潮国产精品| 国产精品suv一区| 国产精品久久久久77777丨| 国产精品入口免费| 被陌生人带去卫生间啪到腿软| 日本年轻的继坶中文字幕| 精品国内自产拍在线观看视频| 国产激情视频网址| 26uuu亚洲综合色欧美| 成人免费高清在线播放| 99精品视频在线播放观看| 精品黑人一区二区三区久久| 日产国产高清一区二区三区| 国产乱码精品一区二三区蜜臂| 伊人亚洲精品| 波多野结衣小视频| 国模无码国产精品视频| h网站免费看| 国产综合亚洲精品一区二| 午夜视频在线观看韩国| 欧美日韩一区二区免费在线观看| 亚洲白拍色综合图区| 日本一区高清在线视频| 一级毛片视频| 美女爆乳18禁www久久久久久| 欧美日韩老妇| 四虎成人精品在永久在线观看| 日本免费高清视频| 亚洲女人初尝黑人巨大| 亚洲精品偷拍| 都市激情亚洲欧美| 欧美aaaaa性bbbbb小妇| 亚洲国产欧美在线观看| 91精品国产三级| 精品人妻一区二区三区换脸明星| 91免费黄视频| 中文字幕资源站| 免费超碰在线| 精品国产乱码久久久久久丨区2区| 暖暖成人免费视频| 蜜桃视频污在线观看| 久久久久亚洲av成人无码电影| 亚洲在线播放| 91popny丨九色丨国产| 久久一二三国产| 精品国产一二三区| 日韩精品中文字幕在线一区| 在线激情小视频| 窝窝九色成人影院| 欧美性猛交内射兽交老熟妇| aⅴ在线视频男人的天堂| 深夜福利91大全| 亚洲靠逼com| 日本少妇吞精囗交| 中文字幕日日夜夜| 国产乱码精品一区二区三区中文| 午夜无码国产理论在线| 4444欧美成人kkkk| 中国丰满人妻videoshd| 色一情一乱一伦一区二区三区| 久久精品人妻一区二区三区| 五月天亚洲综合小说网| 精品噜噜噜噜久久久久久久久试看| 一本一本久久a久久精品综合小说| 一区二区三区免费观看| 91在线播放国产| 秋霞国产午夜精品免费视频| 一区二区三区中文免费| a日韩av网址| 国产精品卡一卡二| 亚洲精品国产精品国自| 国产寡妇树林野战在线播放| 日韩毛片免费看| 亚洲妇女av| 99国内精品久久| a级在线免费观看| 亚洲女同性videos| 丰满岳乱妇一区二区| 无码国产伦一区二区三区视频| 久久精品这里都是精品| 岛国毛片av在线| 精品国产乱码久久久久久蜜臀网站| 久久亚洲精品小早川怜子66| 综合色婷婷一区二区亚洲欧美国产| 97aⅴ精品视频一二三区| 欧美高清电影在线看| 品久久久久久久久久96高清| 色综合天天爱| 美美女免费毛片| 欧美大成色www永久网站婷| 91亚洲精品乱码久久久久久蜜桃| 最新国产精品精品视频| 熟妇人妻av无码一区二区三区| 国产美女视频一区二区三区| 国产欧美日韩亚洲| 亚洲精品不卡在线| 首播影院在线观看免费观看电视| 91一区二区视频| 伊人久久综合网另类网站| 91人人爽人人爽人人精88v| 天天色天天爱天天射综合| 亚洲精品视频网| 欧美日韩视频在线第一区| 欧美一区二区三区电影| 欧美日韩亚洲网| 视频一区二区中文字幕| 嫩草视频在线免费观看| 日本高清视频一区| 精品99一区二区三区| 中文字幕视频在线免费欧美日韩综合在线看| 欧美日本亚洲韩国国产| 亚洲精品国产熟女久久久| 久久在线视频在线| 欧美一级在线免费观看| 国产7777777| 精品视频在线观看一区二区| 国产免费一区二区三区香蕉精| 一区视频二区视频| 日韩在线激情| 亚洲成人久久一区| 天天干,夜夜操| www.91在线观看| 日韩一区二区在线播放| 国产乱码精品一区二区三区四区| 丝袜综合欧美| av成人资源| 亚洲精品第一国产综合精品| aaaaaa亚洲| 国产视频精品在线| 国产l精品国产亚洲区久久| 超碰在线中文| 强制高潮抽搐sm调教高h| 国产激情视频网站| 91在线精品| 中文字幕一区二区三区欧美日韩| 亚洲中文字幕久久精品无码喷水| 久久男人资源站| 后进极品白嫩翘臀在线视频| 中文字幕乱在线伦视频乱在线伦视频| 亚洲高清视频一区二区| caoporm免费视频在线| 国产男女免费视频| 欧美激情在线精品一区二区三区| 国产福利影院在线观看| 欧美综合社区国产| 成人免费观看av| 在线亚洲男人天堂| 亚洲最大福利视频网站| 图片区亚洲欧美小说区| 成人午夜视频免费在线观看| 色综合久久久久综合一本到桃花网| 久久久久成人精品| 精品福利樱桃av导航| 艳色歌舞团一区二区三区| 少妇视频在线| 91久久久久久久久久久久久| 欧美一级黄色带| 亚洲欧美制服中文字幕| 欧美一区二区高清在线观看| 小泽玛利亚视频在线观看| 免费黄色在线视频网站| 国产一级片自拍| 国产精品久久毛片| www.av在线| 福利欧美精品在线| 亚洲天堂网站在线| 黄色www在线观看| 97色在线播放视频| 欧美日韩国产精品激情在线播放| 欧美精品一区二区三区很污很色的| 免费在线观看日韩av| 欧美一级欧美一级| 国产一区二区三区黄视频| 国产精品av在线播放| 午夜影院在线观看视频| 蜜桃av免费观看| 男女性高潮免费网站| 5252色成人免费视频| 亚洲欧洲av色图| 亚洲欧洲日韩在线| 女人和拘做爰正片视频| 一区二区三区偷拍| 亚洲人成人一区二区三区| 日韩亚洲电影在线| 欧美综合久久久| 菠萝蜜视频在线观看入口| 国产最新自拍视频| 黑人巨茎大战欧美白妇| 日本精品一区二区三区在线| 波多野结衣中文字幕一区二区三区| 女人抽搐喷水高潮国产精品| 福利视频亚洲| 国产精品高潮在线| 电影亚洲一区| 一区中文字幕| 欧美精品电影在线播放| 国产视频在线观看一区二区三区| 欧美一级三级| 国产一区在线观| freemovies性欧美| 一级aaaa毛片| 久久精品国产理论片免费| 又黄又爽的视频在线观看| 国产+人+亚洲| 国产在线观看www| 国产成人香蕉在线视频fuz| 搞黄视频免费在线观看| 男女免费观看在线爽爽爽视频| 日本五十肥熟交尾| 国产美女网站在线观看| 久久精品xxx| 蜜臀av一区二区三区| 欧美极品欧美精品欧美视频| 九色精品91| 一女二男一黄一片| 欧美精品videos另类| 黄色av地址| 欧美一级网站| 国产韩国精品一区二区三区| 欧美一级免费看| 萌白酱视频在线| 在线观看免费视频国产| 国产精品夜间视频香蕉| 97精品国产97久久久久久久久久久久| 日本午夜精品一区二区| 波多野结衣av在线免费观看| 91丝袜一区二区三区| 在线观看免费电影| 亚洲一一在线| 亚洲精品一线二线三线| 51精品视频一区二区三区| 国产精品成人网站| 露脸国产精品自产在线播| 日韩啪啪网站| 制服诱惑一区二区| 制服丝袜中文字幕在线观看| 色综合天天综合网国产成人综合天| 欧美日韩欧美一区二区| 国产91精品久久久久久久网曝门| 日本一级理论片在线大全| 欧美三级第一页| 最近免费中文字幕视频2019| 手机福利小视频在线播放| 欧美色女视频| 色偷偷久久人人79超碰人人澡| 99热在线免费| 女同一区二区免费aⅴ| 麻豆九一精品爱看视频在线观看免费| 国产精品伦一区二区三区视频| 在线人成日本视频| 国产99精品一区| 久久福利精品| 色噜噜狠狠一区二区三区狼国成人| 草草久久久无码国产专区| xxww在线观看| 国产精品高清无码| www.国产精品一二区| 中文字幕一二区| 亚洲国产视频a| 最新国产精品久久久|