成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識庫 > 詳解使用Selenium爬取豆瓣電影前100的愛情片相關(guān)信息

詳解使用Selenium爬取豆瓣電影前100的愛情片相關(guān)信息

熱門標(biāo)簽:百應(yīng)ai電銷機(jī)器人鄭州 如何在地圖標(biāo)注文字 n400電話申請多少錢 女王谷地圖標(biāo)注 地圖標(biāo)注推廣單頁 ai地圖標(biāo)注 西藏快速地圖標(biāo)注地點 長春人工智能電銷機(jī)器人官網(wǎng) 廈門crm外呼系統(tǒng)如何

什么是Selenium

Selenium是一個用于測試網(wǎng)站的自動化測試工具,支持各種瀏覽器包括Chrome、Firefox、Safari等主流界面瀏覽器,同時也支持phantomJS無界面瀏覽器。

1.準(zhǔn)備工作

由于Selenium的環(huán)境配置過程比較繁瑣,我會盡可能詳細(xì)的對其進(jìn)行講解。

1.1 安裝Selenium

由于Selenium的環(huán)境配置過程比較繁瑣,我會多花一些篇幅對其進(jìn)行講解??梢栽赾md命令框輸入以下內(nèi)容安裝Selenium庫。

pip install Selenium

1.2 瀏覽器驅(qū)動安裝

Selenium的使用必須有相應(yīng)瀏覽器的webdriver,以Chrome瀏覽器為例,可以在這個鏈接查看自己的瀏覽器對應(yīng)的Chromedriver的版本。

1.3 環(huán)境變量添加

設(shè)置瀏覽器的地址非常簡單。 我們可以手動創(chuàng)建一個存放瀏覽器驅(qū)動的目錄, , 將下載的瀏覽器驅(qū)動文件丟到該目錄下。然后在我的電腦–>屬性–>系統(tǒng)設(shè)置–>高級–>環(huán)境變量–>系統(tǒng)變量–>Path,將該目錄添加到Path的值中。如果配置變量有問題,可以參照這個鏈接

注意,如果系統(tǒng)報錯為:

selenium.common.exceptions.SessionNotCreatedException: Message: session not created:This version of ChromeDriver only supports Chrome version***

表示當(dāng)前下載的Chromedriver的版本與自己瀏覽器的版本無法對應(yīng),可以通過Chrome的幫助查看自己的瀏覽器版本

1.4 小試牛刀

接下來就可以測試我們的selenium是不是可以正常使用了,以一個簡單的例子開始:驅(qū)動瀏覽器打開百度。

from selenium import webdriver

url='https://www.baidu.com/'
browser=webdriver.Chrome()
browser.get(url)

如果到這里都沒有問題的話,就已經(jīng)可以開始進(jìn)行下一步了。

2.相關(guān)步驟

2.1 引入相關(guān)模塊

首先導(dǎo)入本次爬蟲任務(wù)需要的相關(guān)庫:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
import time

其中selenium.webdriver.common.by 主要用于搜尋網(wǎng)頁元素的id信息,用于定位按鈕、輸入框之類的元素,WebDriverWait主要是用于等待網(wǎng)頁響應(yīng)完成,因為網(wǎng)頁沒有完全加載,就使用find_elements_by_**等方法,就會出現(xiàn)找不到對應(yīng)元素的情況。

2.2 獲取信息

movies=browser.find_elements_by_class_name('movie-name-text')
  names=[]
  for item in movies:
    if item.text!='':
      names.append(item.text)

其中find_elements_by_class_name就是通過查找class_name來鎖定影片名稱這個信息。

審查元素后右鍵即可Copy這個元素的JS path,selector等信息,可以鎖定這個元素及其類似的其他元素的信息。以‘霸王別姬'這部影片為例,他的selector就是#content > div > div.article > div.movie-list-panel.pictext > div:nth-child(1) > div > div > div.movie-name > span.movie-name-text > a
那么就可以用下面的代碼來鎖定影片名稱。

movies=browser.find_elements_by_class_name('#content > div > div.article > div.movie-list-panel.pictext > div:nth-child(1) > div > div > div.movie-name > span.movie-name-text > a')

2.3 設(shè)置等待時間

前面已經(jīng)說過,如果頁面還沒有完全加載出,我們就進(jìn)行元素的查找,返回的很可能是空列表,所以我們需要設(shè)置等待時間。
這里就涉及到顯示等待和隱式等待的區(qū)別。

2.3.1 顯式等待
每隔一段時間檢測一次當(dāng)前頁面元素是否存在,如果超過設(shè)置時間檢測不到則拋出異常(TimeoutException)代碼格式:WebDriverWait(driver, timeout, poll_frequency=0.5, ignored_exceptions=None)

2.3.2 隱式等待
隱式等待是通過一定的時長等待頁面上某個元素加載完成。如果超出了設(shè)置的時長元素還沒有被加載,則拋出NoSuchElementException異常。
操作如下:implicitly_wait()
當(dāng)使用了隱式等待執(zhí)行測試的時候,如果 WebDriver沒有在 DOM中找到元素,將繼續(xù)等待,超出設(shè)定時間后則拋出找不到元素的異常換句話說,當(dāng)查找元素或元素并沒有立即出現(xiàn)的時候,隱式等待將等待一段時間再查找 DOM,默認(rèn)的時間是0,一旦設(shè)置了隱式等待,則它存在整個 WebDriver 對象實例的聲明周期中,隱式的等到會讓一個正常響應(yīng)的應(yīng)用的測試變慢,它將會在尋找每個元素的時候都進(jìn)行等待,這樣會增加整個測試執(zhí)行的時間。我們這里使用的就是隱式等待。

def get_page():
  browser.implicitly_wait(10)
  for i in range(50):
    time.sleep(0.3)
    browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')
    print('正在下滑第{}次'.format(i))
    print('-------------')
  #time.sleep(10)
  print("*****請等待幾秒*****")
  time.sleep(10)
  when=wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR,'#content > div > div.article > div.movie-list-panel.pictext > div:nth-child(380) > div > a > img')))

2.3.3 強(qiáng)制等待(補(bǔ)充)
強(qiáng)制等待就是使用python自帶的time模塊,設(shè)置等待時間,操作如下:time.sleep(time)一般可以用強(qiáng)制等待來限制計算機(jī)頻繁訪問目標(biāo)鏈接導(dǎo)致驗證問題。

2.4 頁面自動下滑

頁面下滑過程比較簡單,不多贅述。其實現(xiàn)過程如下:

browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')#下滑操作

2.5 保存文件

爬取出的數(shù)據(jù)是列表形式,使用pandas的to_csv方法就可以保存到本地了。

rate,miscs,actor_list,ranks,playable_sign,names=get_page()
  datas=pd.DataFrame({'names':names,'rank':ranks,'分類':miscs,'評分':rate})
  try:
    datas.to_csv('機(jī)器學(xué)習(xí)\爬蟲\douban_0327.csv',encoding='utf_8_sig')
    print("保存成功")
    print(datas)

3.完整代碼

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
import pandas as pd
import time

url='https://movie.douban.com/typerank?type_name=愛情片type=13interval_id=100:90action='
options=webdriver.ChromeOptions()
options.add_argument('lang=zh_CN.UTF-8')
options.add_argument('user-agent="Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"')
browser=webdriver.Chrome()
browser.get(url)
wait=WebDriverWait(browser,10)
def get_page():
  browser.implicitly_wait(10)
  for i in range(50):
    time.sleep(0.3)
    browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')#下滑操作
    print('正在下滑第{}次'.format(i))
    print('-------------')
  #time.sleep(10)
  print("*****請等待幾秒*****")
  time.sleep(10)
  when=wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR,'#content > div > div.article > div.movie-list-panel.pictext > div:nth-child(380) > div > a > img')))
#-----------------------------------------------------------------
  movies=browser.find_elements_by_class_name('movie-name-text')
  names=[]
  for item in movies:
    if item.text!='':
      names.append(item.text)
  print("爬取成功")
  print(len(names))
#---------------------------------------------------------------
  playables=browser.find_elements_by_class_name('playable-sign')
  playable_sign=[]
  for sign in playables:
    if sign.text!='':
      playable_sign.append(sign.text)
  print('爬取成功')
  print(len(playable_sign))
#------------------------------------------------------------
  rank_names=browser.find_elements_by_class_name('rank-num')
  ranks=[]
  for rank in rank_names:
    if rank.text!='':
      ranks.append(rank.text)
  print('爬取成功')
  print(len(ranks))
#---------------------------------------------------------
  actors=browser.find_elements_by_class_name('movie-crew')
  actor_list=[]
  for actor in actors:
    if actor.text!='':
      actor_list.append(actor.text)
  print('爬取成功')
  print(len(actor_list))
#----------------------------------------------------------
  clasic=browser.find_elements_by_class_name('movie-misc')
  miscs=[]
  for misc in clasic:
    if misc.text!='':
      miscs.append(misc.text)
  print('爬取成功')
  print(len(miscs))
#-----------------------------------------------------------
  rates=browser.find_elements_by_class_name('movie-rating')
  rate=[]
  for score in rates:
    if score.text!='':
      rate.append(score.text)
  print('爬取成功')
  print(len(rate))
#-----------------------------------------------------------
  '''
  links=browser.find_elements_by_class_name('movie-content')
  for link in links:
    link_img=link.get_attribute('data-original')
    print(link_img)
  '''
  return rate,miscs,actor_list,ranks,playable_sign,names

if __name__ == "__main__":
  rate,miscs,actor_list,ranks,playable_sign,names=get_page()
  datas=pd.DataFrame({'names':names,'rank':ranks,'分類':miscs,'評分':rate})
  try:
    datas.to_csv('機(jī)器學(xué)習(xí)\爬蟲\douban_0327.csv',encoding='utf_8_sig')
    print("保存成功")
    print(datas)
  except:
    print('保存失敗')

到此這篇關(guān)于詳解使用Selenium爬取豆瓣電影前100的愛情片相關(guān)信息的文章就介紹到這了,更多相關(guān)Selenium爬取豆瓣電影內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python Selenium爬取內(nèi)容并存儲至MySQL數(shù)據(jù)庫的實現(xiàn)代碼
  • Python使用Selenium+BeautifulSoup爬取淘寶搜索頁
  • Scrapy基于selenium結(jié)合爬取淘寶的實例講解
  • python爬蟲系列Selenium定向爬取虎撲籃球圖片詳解
  • Python使用Selenium爬取淘寶異步加載的數(shù)據(jù)方法
  • scrapy與selenium結(jié)合爬取數(shù)據(jù)(爬取動態(tài)網(wǎng)站)的示例代碼
  • 詳解python selenium 爬取網(wǎng)易云音樂歌單名
  • Python selenium爬取微信公眾號文章代碼詳解
  • java+selenium爬取圖片簽名的方法
  • Python selenium爬取微博數(shù)據(jù)代碼實例

標(biāo)簽:內(nèi)江 廊坊 拉薩 亳州 綿陽 渭南 黔東 興安盟

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《詳解使用Selenium爬取豆瓣電影前100的愛情片相關(guān)信息》,本文關(guān)鍵詞  詳解,使用,Selenium,爬取,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《詳解使用Selenium爬取豆瓣電影前100的愛情片相關(guān)信息》相關(guān)的同類信息!
  • 本頁收集關(guān)于詳解使用Selenium爬取豆瓣電影前100的愛情片相關(guān)信息的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    国产精品裸体一区二区三区| 欧美日韩一卡二卡| 中文字幕无人区二| 污污视频网站在线免费观看| 99久久国产综合精品色伊| 99re热久久这里只有精品34| 激情久久99| 人人澡人人澡人人看| 嫩草影院一区二区三区| 国产精品色在线| 亚洲不卡一卡2卡三卡4卡5卡精品| 亚洲成人黄色网| eeuss在线观看| 色婷婷成人综合| 亚洲综合激情视频| 国内自拍视频在线观看| 美女黄色丝袜一区| 操你啦在线视频| 欧美做爰啪啪xxxⅹ性| 国产精品不卡在线观看| 欧美日韩伦理在线免费| 国产亚洲视频在线| 国产剧情久久久| 中文在线字幕免费观| 日日摸夜夜爽人人添av| 激情小说中文字幕| 精品国产福利一区二区在线| 国产无精乱码一区二区三区| 黄色大片免费看| 超碰人人在线| 亚洲色图在线播放| 国产一区二区三区免费| 日韩欧美精品在线观看视频| 黄色一区三区| 国产日韩欧美另类| 精品免费日产一区一区三区免费| 老司机aⅴ在线精品导航| 高潮白浆女日韩av免费看| 1024精品一区二区三区| 成人天堂yy6080亚洲高清| 特色特色大片在线| 国产一区二区高清不卡| 少妇无套内谢久久久久| 国产精品久久久久久一区二区三区| 欧美日韩激情在线| www操com| 欧美日韩亚州综合| 国产清纯白嫩初高中在线观看性色| 欧美麻豆精品久久久久久| 综合激情国产一区| 欧美激情一二区| 青青草综合网| 亚洲综合精品久久| 韩国日本在线视频| 国产av人人夜夜澡人人爽麻豆| 九九热免费精品视频| 日韩中字在线| 久久久久久艹| 夜夜嗨av色综合久久久综合网| 91高跟黑色丝袜呻吟在线观看| 久久精品—区二区三区舞蹈| 在线最新版中文在线| 99国产在线观看| 久久er99热精品一区二区三区| 婷婷五月精品中文字幕| 97婷婷涩涩精品一区| 久久国产视频网| 成熟的女同志hd| 国产日韩欧美综合在线| www.555国产精品免费| 成人在线观看高清| 97人澡人人添人人爽欧美| 在线一区二区三区视频| 亚洲美女一区二区三区| 亚洲欧洲精品天堂一级| 国产精品美女无圣光视频| 亚洲春色一区二区三区| 美女被爆操网站| 少妇免费毛片久久久久久久久| 一区二区激情| 最新国产精品久久| 成人午夜剧场免费观看完整版| 亚洲成av人综合在线观看| 色片在线免费观看| 亚洲男同1069视频| 久久av偷拍| 激情视频一区| 中文字幕在线观看不卡| 国产激情欧美| 欧美午夜不卡| 欧美情侣在线播放| 天堂蜜桃一区二区三区| 成人搞黄视频| 国产精品久久久久久久岛一牛影视| 无人码人妻一区二区三区免费| 一区二区三区免费观看视频| 91精品国产黑色紧身裤美女| 欧美视频完全免费看| 久久这里只有精品8| 日韩高清在线观看一区二区| 国产精品久久久久毛片| 国产精品22p| 人妻91麻豆一区二区三区| 最近免费中文字幕大全免费第三页| 韩国av中文字幕| 久久在线电影| 亚洲成人短视频| 一区二区三区高清不卡| 亚洲精品wwww| 国产精品偷伦视频免费观看了| 国产成人在线小视频| 俺来俺也去www色在线观看| 日韩有码第一页| 一本色道久久综合狠狠躁篇怎么玩| 国产又粗又长又爽又黄的视频| 婷婷视频在线观看| 国产日韩欧美一区二区三区| www.xx日本| 9国产精品视频| 欧美午夜片在线看| 国产精品久久久久av福利动漫| 日本人亚洲人jjzzjjz| 欧美天堂亚洲电影院在线观看| 麻豆一区区三区四区产品精品蜜桃| 欧美一区二区性放荡片| 成人精品天堂一区二区三区| 国产一级淫片a| 欧美日韩123区| 国产精品美女在线播放| 操人视频免费看| 在线视频亚洲专区| 成人福利视频| 丝袜久久网站| 农村妇女精品一二区| 亚洲区免费影片| 成人高清在线观看免费| 久久最新资源网| 日本中文字幕电影在线免费观看| 日韩专区在线播放| 夜夜春很很躁夜夜躁| 福利视频网站导航| 国内国产精品久久| 久久久久99人妻一区二区三区| 国产又爽又黄免费软件| 免费吸乳羞羞网站视频| 色香蕉在线视频| 91美女免费看| 天天av天天翘天天综合网| 妺妺窝人体色www聚色窝仙踪| 久久成人免费网站| 欧美色图片区| 婷婷综合成人| 色欧美日韩亚洲| 精品日本一区二区三区| 国产免费一区二区三区四区| a视频免费看| www.夜色| 麻豆成人免费电影| 亚洲人成电影网站色…| 自拍偷拍欧美日韩| 国产精品美女久久久久高潮| caopon在线免费视频| 免费下载黄色软件| 中文字幕免费高| 18成人免费观看视频| 国产亚洲无码精品| 国产精品久久久久久人| 99在线|亚洲一区二区| 免费电影日韩网站| 日韩精品一区二| 亚洲综合丁香| 精品少妇人妻一区二区黑料社区| 国产亚洲欧洲| av成人午夜| 久久国产精品久久| 色戒在线免费观看| 亚洲欧洲av一区二区| 欧美高清视频看片在线观看| 国产一级影片| 久久精品国产精品亚洲| 国产经典一区二区| 91久久精品国产91久久性色| 日本中文字幕中出在线| 亚洲精品菠萝久久久久久久| 色天使久久综合网天天| 免费观看成人网| 国产精品亚洲欧美导航| 亚洲天堂精品在线| 黄色亚洲精品| 国模精品一区二区| 一区视频二区视频| 桃乃木香奈和黑人aⅴ在线播放| 久久久久久久久久久久久久久久久久av| 精品一区二区不卡| 国产精品乱人伦| 亚洲清纯自拍| 91精品国产综合久久香蕉922| 91免费看国产| 欧美日韩一区二区三区四区不卡| 国产91精品久久久久久久网曝门| 高清全集视频免费在线| 国产精品一区二区三区高清在线| 国产一区在线看| 97人妻精品一区二区三区动漫| 四虎电影院在线观看| 国产在线看片| 你懂的在线视频观看| 性色av免费观看| 3d动漫精品啪啪一区二区三区免费| 性史性dvd影片农村毛片| 这里视频有精品| 99re在线观看视频| 久久午夜av| 蜜桃专区在线| 日韩精品一区二区三区在线播放| 中文字幕在线观看一区二区三区| 日韩在线播放一区| 国产精品日韩| 国产精品美女呻吟| 91美女片黄在线观看91美女| 人妻精品无码一区二区三区| 尤物在线免费视频| 国产噜噜噜噜噜久久久久久久久| 国产精品久久久久久久免费观看| 色综合久久中文综合久久牛| 国产精品久久国产愉拍| 我的公把我弄高潮了视频| 黄视频网站在线看| 日韩电影中文字幕在线观看| 天堂av中文在线| 国产第一页在线视频| 电影天堂国产精品| 夜夜添无码一区二区三区| 成人做爰视频www| 91九色蝌蚪视频| 天天做夜夜做人人爱精品| 成人免费一区二区三区在线观看| 成人片黄网站色大片免费毛片| 成人资源在线播放| 国产精品久久久久9999赢消| 九九精品调教| 黑人と日本人の交わりビデオ| 久久亚洲精品一区二区| 久久精品99国产精品| 欧美24videosex性欧美| 超碰在线免费播放| 国产综合中文字幕| 成人av在线看| 寂寞护士中文字幕mp4| 狠狠色噜噜狠狠狠狠色吗综合| 欧美综合一区二区三区| 精品国产第一福利网站| 欧美精品黑人猛交高潮| 欧美一区二区三区免费观看| 日本亚洲欧洲色| 日韩av中文字幕第一页| 亚洲日本伊人| 亚洲精品视频在线| 国产精品久久久久久模特| 老汉色老汉首页av亚洲| 亚洲图片自拍偷拍| 91成人精品在线| 欧美一区高清| 久久综合九色欧美狠狠| 欧美四级电影网| 四虎国产精品永久在线| 久久99精品国产| 黑人精品xxx一区一二区| 黑人玩弄人妻一区二区三区| 国产日韩欧美| 久久精品91久久香蕉加勒比| 国产精品丝袜黑色高跟| 亚洲美女自拍视频| 一二三在线视频社区| 成年人小视频在线观看| 欧美国产综合| 深爱激情综合网| 亚洲精品白浆高清| a毛片在线看免费观看| 亚洲精品乱码久久久久久不卡| 九九综合九九| 国产福利亚洲| 成人免费在线一区二区三区| 成人图片小说| youjizz在线视频| 妞干网在线视频观看| 中文字幕欧美国产| 中文字幕理伦片免费看| 在线免费视频a| 92国产精品久久久久首页| 7777精品伊人久久久大香线蕉经典版下载| 日韩视频在线一区| 欧美极品少妇与黑人| 草草视频在线观看| www.毛片.com| 国产三级伦理在线| 国产成人高清激情视频在线观看| 依依成人在线视频| 粗大的内捧猛烈进出视频| 亚洲综合在线网站| 免费大秀视频在线播放| 国产精品毛片久久| 亚洲欧美中文日韩v在线观看| 久久久亚洲精品一区二区三区| 国产亚洲精品成人| 久久一卡二卡| 久久视频免费在线观看| 亚洲一区二区综合| 五月天一区二区| 欧美午夜视频网站| 日韩电视剧免费观看网站| 久久亚洲天堂网| 97电影在线| 香蕉视频网站在线观看| 狠狠综合久久av一区二区老牛| 久久久久国产一区二区三区| 五月天婷婷社区| 中文字幕一二区| 亚洲四区在线观看| 国内精品国产三级国产99| 黄色片一区二区三区| 黄色仓库视频网站| 另类小说欧美激情| 亚洲av午夜精品一区二区三区| 国产高清免费在线播放| 91亚洲精品国偷拍自产在线观看| 捆绑裸体绳奴bdsm亚洲| 丝袜综合欧美|