成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識庫 > 只用50行Python代碼爬取網(wǎng)絡(luò)美女高清圖片

只用50行Python代碼爬取網(wǎng)絡(luò)美女高清圖片

熱門標簽:所得系統(tǒng)電梯怎樣主板設(shè)置外呼 市場上的電銷機器人 北京電銷外呼系統(tǒng)加盟 地圖標注面積 北瀚ai電銷機器人官網(wǎng)手機版 小蘇云呼電話機器人 佛山400電話辦理 朝陽手機外呼系統(tǒng) 儋州電話機器人

一、技術(shù)路線

requests:網(wǎng)頁請求
BeautifulSoup:解析html網(wǎng)頁
re:正則表達式,提取html網(wǎng)頁信息
os:保存文件

import re
import requests
import os
from bs4 import BeautifulSoup

二、獲取網(wǎng)頁信息

常規(guī)操作,獲取網(wǎng)頁信息的固定格式,返回的字符串格式的網(wǎng)頁內(nèi)容,其中headers參數(shù)可模擬人為的操作,‘欺騙'網(wǎng)站不被發(fā)現(xiàn)

def getHtml(url):  #固定格式,獲取html內(nèi)容
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
    }  #模擬用戶操作
    try:
        r = requests.get(url, headers=headers)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        print('網(wǎng)絡(luò)狀態(tài)錯誤')

三、網(wǎng)頁爬取分析

右鍵單擊圖片區(qū)域,選擇 ‘審查元素' ,可以查看當(dāng)前網(wǎng)頁圖片詳情鏈接,我就滿心歡喜的復(fù)制鏈接打開保存,看看效果,結(jié)果一張圖片只有60幾kb,這就是縮略圖啊,不清晰,果斷舍棄。。。


沒有辦法,只有點擊找到詳情頁鏈接,再進行單獨爬取。

空白右鍵,‘查看頁面源代碼',把剛剛復(fù)制的縮略圖鏈接復(fù)制查找快速定位,分析所有圖片詳情頁鏈接存在div標簽,并且class=‘list' 唯一,因此可以使用BeautifulSoup提取此標簽。并且發(fā)現(xiàn)圖片詳情頁鏈接在herf=后面(同時我們注意到有部分無效鏈接也在div標簽中,觀察它們異同,發(fā)現(xiàn)無效鏈接存在'https'字樣,因此可在代碼中依據(jù)此排出無效鏈接,對應(yīng)第4條中的函數(shù)代碼),只需提取出來再在前面加上網(wǎng)頁首頁鏈接即可打開,并且右鍵圖片,‘審查元素',復(fù)制鏈接下載的圖片接近1M,表示是高清圖片了,到這一步我們只需調(diào)用下載保存函數(shù)即可保存圖片

四、網(wǎng)頁詳情頁鏈接獲取

根據(jù)第3條分析的情況,首要目標是將每頁的每個圖片的詳情頁鏈接給爬取下來,為后續(xù)的高清圖片爬取做準備,這里直接定義函數(shù)def getUrlList(url):

def getUrlList(url):  # 獲取圖片鏈接
    url_list = []  #存儲每張圖片的url,用于后續(xù)內(nèi)容爬取
    demo = getHtml(url)
    soup = BeautifulSoup(demo,'html.parser')
    sp = soup.find_all('div', class_="list") #class='list'在全文唯一,因此作為錨,獲取唯一的div標簽;注意,這里的網(wǎng)頁源代碼是class,但是python為了和class(類)做區(qū)分,在最后面添加了_
    nls = re.findall(r'a href="(.*?)" rel="external nofollow"  rel="external nofollow" ', str(sp)) #用正則表達式提取鏈接
    for i in nls:
        if 'https' in i: #因所有無效鏈接中均含有'https'字符串,因此直接剔除無效鏈接(對應(yīng)第3條的分析)
            continue
        url_list.append('http://www.netbian.com' + i) #在獲取的鏈接中添加前綴,形成完整的有效鏈接
    return url_list

五、依據(jù)圖片鏈接保存圖片

同理,在第4條中獲取了每個圖片的詳情頁鏈接后,打開,右鍵圖片'審查元素',復(fù)制鏈接即可快速定位,然后保存圖片

def fillPic(url,page):
    pic_url = getUrlList(url) #調(diào)用函數(shù),獲取當(dāng)前頁的所有圖片詳情頁鏈接
    path = './美女'  # 保存路徑
    for p in range(len(pic_url)):
        pic = getHtml(pic_url[p])
        soup = BeautifulSoup(pic, 'html.parser')
        psoup = soup.find('div', class_="pic") #class_="pic"作為錨,獲取唯一div標簽;注意,這里的網(wǎng)頁源代碼是class,但是python為了和class(類)做區(qū)分,在最后面添加了_
        picUrl = re.findall(r'src="(.*?)"', str(psoup))[0] #利用正則表達式獲取詳情圖片鏈接,因為這里返回的是列表形式,所以取第一個元素(只有一個元素,就不用遍歷的方式了)
        pic = requests.get(picUrl).content #打開圖片鏈接,并以二進制形式返回(圖片,聲音,視頻等要以二進制形式打開)
        image_name ='美女' + '第{}頁'.format(page) + str(p+1) + '.jpg' #給圖片預(yù)定名字
        image_path = path + '/' + image_name #定義圖片保存的地址
        with open(image_path, 'wb') as f: #保存圖片
            f.write(pic)
            print(image_name, '下載完畢?。。?)

六、main()函數(shù)

經(jīng)過前面的主體框架搭建完畢之后,對整個程序做一個前置化,直接上代碼

在這里第1頁的鏈接是http://www.netbian.com/meinv/

第2頁的鏈接是http://www.netbian.com/meinv/index_2.htm

并且后續(xù)頁面是在第2頁的基礎(chǔ)上僅改變最后的數(shù)字,因此在寫代碼的時候要注意區(qū)分第1頁和后續(xù)頁面的鏈接,分別做處理;同時在main()函數(shù)還增加了自定義爬取頁數(shù)的功能,詳見代碼

def main():
    n = input('請輸入要爬取的頁數(shù):')
    url = 'http://www.netbian.com/meinv/'  # 資源的首頁,可根據(jù)自己的需求查看不同分類,自定義改變目錄,爬取相應(yīng)資源
    if not os.path.exists('./美女'):  # 如果不存在,創(chuàng)建文件目錄
        os.mkdir('./美女/')
    page = 1
    fillPic(url, page)  # 爬取第一頁,因為第1頁和后續(xù)頁的鏈接的區(qū)別,單獨處理第一頁的爬取
    if int(n) >= 2: #爬取第2頁之后的資源
        ls = list(range(2, 1 + int(n)))
        url = 'http://www.netbian.com/meinv/'
        for i in ls: #用遍歷的方法對輸入的需求爬取的頁面做分別爬取處理
            page = str(i)
            url_page = 'http://www.netbian.com/meinv/'
            url_page += 'index_' + page + '.htm' #獲取第2頁后的每頁的詳情鏈接
            fillPic(url, page) #調(diào)用fillPic()函數(shù)

七、完整代碼

最后再調(diào)用main(),輸入需要爬取的頁數(shù),即可開始爬取,完整代碼如下

import re
import requests
import os
from bs4 import BeautifulSoup

def getHtml(url):  #固定格式,獲取html內(nèi)容
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
    }  #模擬用戶操作
    try:
        r = requests.get(url, headers=headers)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        print('網(wǎng)絡(luò)狀態(tài)錯誤')

def getUrlList(url):  # 獲取圖片鏈接
    url_list = []  #存儲每張圖片的url,用于后續(xù)內(nèi)容爬取
    demo = getHtml(url)
    soup = BeautifulSoup(demo,'html.parser')
    sp = soup.find_all('div', class_="list") #class='list'在全文唯一,因此作為錨,獲取唯一的div標簽;注意,這里的網(wǎng)頁源代碼是class,但是python為了和class(類)做區(qū)分,在最后面添加了_
    nls = re.findall(r'a href="(.*?)" rel="external nofollow"  rel="external nofollow" ', str(sp)) #用正則表達式提取鏈接
    for i in nls:
        if 'https' in i: #因所有無效鏈接中均含有'https'字符串,因此直接剔除無效鏈接(對應(yīng)第3條的分析)
            continue
        url_list.append('http://www.netbian.com' + i) #在獲取的鏈接中添加前綴,形成完整的有效鏈接
    return url_list

def fillPic(url,page):
    pic_url = getUrlList(url) #調(diào)用函數(shù),獲取當(dāng)前頁的所有圖片詳情頁鏈接
    path = './美女'  # 保存路徑
    for p in range(len(pic_url)):
        pic = getHtml(pic_url[p])
        soup = BeautifulSoup(pic, 'html.parser')
        psoup = soup.find('div', class_="pic") #class_="pic"作為錨,獲取唯一div標簽;注意,這里的網(wǎng)頁源代碼是class,但是python為了和class(類)做區(qū)分,在最后面添加了_
        picUrl = re.findall(r'src="(.*?)"', str(psoup))[0] #利用正則表達式獲取詳情圖片鏈接,因為這里返回的是列表形式,所以取第一個元素(只有一個元素,就不用遍歷的方式了)
        pic = requests.get(picUrl).content #打開圖片鏈接,并以二進制形式返回(圖片,聲音,視頻等要以二進制形式打開)
        image_name ='美女' + '第{}頁'.format(page) + str(p+1) + '.jpg' #給圖片預(yù)定名字
        image_path = path + '/' + image_name #定義圖片保存的地址
        with open(image_path, 'wb') as f: #保存圖片
            f.write(pic)
            print(image_name, '下載完畢?。?!')

def main():
    n = input('請輸入要爬取的頁數(shù):')
    url = 'http://www.netbian.com/meinv/'  # 資源的首頁,可根據(jù)自己的需求查看不同分類,自定義改變目錄,爬取相應(yīng)資源
    if not os.path.exists('./美女'):  # 如果不存在,創(chuàng)建文件目錄
        os.mkdir('./美女/')
    page = 1
    fillPic(url, page)  # 爬取第一頁,因為第1頁和后續(xù)頁的鏈接的區(qū)別,單獨處理第一頁的爬取
    if int(n) >= 2: #爬取第2頁之后的資源
        ls = list(range(2, 1 + int(n)))
        url = 'http://www.netbian.com/meinv/'
        for i in ls: #用遍歷的方法對輸入的需求爬取的頁面做分別爬取處理
            page = str(i)
            url_page = 'http://www.netbian.com/meinv/'
            url_page += 'index_' + page + '.htm' #獲取第2頁后的每頁的詳情鏈接
            fillPic(url_page, page) #調(diào)用fillPic()函數(shù)

main()

到此這篇關(guān)于只用50行Python代碼爬取網(wǎng)絡(luò)美女高清圖片的文章就介紹到這了,更多相關(guān)Python爬取圖片內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python opencv通過按鍵采集圖片源碼
  • 使用Python的Scrapy框架十分鐘爬取美女圖
  • Python使用爬蟲抓取美女圖片并保存到本地的方法【測試可用】
  • Python制作爬蟲抓取美女圖
  • python制作花瓣網(wǎng)美女圖片爬蟲
  • Python爬蟲入門案例之回車桌面壁紙網(wǎng)美女圖片采集

標簽:江蘇 酒泉 金融催收 龍巖 定西 云南 寧夏 商丘

巨人網(wǎng)絡(luò)通訊聲明:本文標題《只用50行Python代碼爬取網(wǎng)絡(luò)美女高清圖片》,本文關(guān)鍵詞  只用,50行,Python,代碼,爬取,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《只用50行Python代碼爬取網(wǎng)絡(luò)美女高清圖片》相關(guān)的同類信息!
  • 本頁收集關(guān)于只用50行Python代碼爬取網(wǎng)絡(luò)美女高清圖片的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    欧美熟妇激情一区二区三区| 国产黄色小视频网站| 痴汉一区二区三区| 日韩欧美伦理电影院| 国产一级做a爰片久久| 亚洲日本韩国一区| 四虎4hu影库永久地址| 亚洲欧美国产三级| 成人免费电影视频| 日韩成人av电影| 久操视频免费看| 亚洲精品乱码久久久久久| 亚洲淫成人影院| 九九久久精品这里久久网| 成人免费黄色大片| 波多野结衣啪啪| 亚洲一区二区在线免费观看| 最好看的中文字幕久久| 波多野结衣一本一道| 99riav国产精品视频| 欧美久久综合性欧美| 欧美国产高潮xxxx1819| a级片免费视频| 永久免费不卡在线观看黄网站| 久久一级黄色片| 亚洲精品在线免费| 国产黄色精品| 免费日韩一区二区三区| 国产精品一区二区三区精品| 88国产精品欧美一区二区三区| 天天干 天天插| 婷婷视频在线播放| 国产精品美女视频| 好吊色欧美一区二区三区视频| 91网在线观看| 欧美另类z0zxhd电影| 国偷自产av一区二区三区麻豆| 日韩精品在线视频观看| 国产日韩精品中文字无码| 欧美经典一区| 国产精品免费区二区三区观看| 成人在线二区| 91午夜在线观看| 免费在线观看a级片| 欧美日韩国产综合一区二区三区| 亚洲欧美一区二区三区四区五区| 久久久免费毛片| 污污的网站在线免费观看| 特级特黄刘亦菲aaa级| 久久国产天堂福利天堂| 国产精品第五页| 国产免费av高清在线| 久久99久久人婷婷精品综合| 免费高清av| 在线天堂av| 亚洲成人网久久久| 欧美亚洲综合色| 97超碰国产一区二区三区| 久久人人爽亚洲精品天堂| 希岛爱理一区二区三区av高清| 国产欧美视频一区| 国产伦精品一区二区| 99精品久久| 国产制服91一区二区三区制服| 国产视频手机在线播放| 岛国av午夜精品| 国产成a人亚洲| 国产成人在线中文字幕| 亚洲自拍三区| 久久久久久久久伊人| 欧美成在线观看| 国产真实乱子伦精品视频| 粉嫩av一区二区三区天美传媒| 国产精品第一页第二页第三页| 欧美亚洲福利| 欧美午夜精品理论片a级大开眼界| 国产真实乱偷精品视频免| 午夜影院免费播放| 国产精品福利导航| 波多野结衣三级视频| 日本韩国欧美在线| 岳毛多又紧做起爽| 亚洲你懂的在线视频| 色婷婷亚洲精品| 久久亚区不卡日本| 中文字幕超碰在线| 成人在线播放视频| 国产亚洲欧美视频| 在线观看日本一区二区| 日韩午夜激情av| 国产精品少妇在线视频| 日产国产精品精品a∨| 欧美激情一区二区| 欧美色综合影院| 91香蕉电影院| 东方伊人免费在线观看| 国产激情视频一区二区三区| 国产日韩欧美精品电影三级在线| 久久久久久久久久久久国产精品| 毛片基地黄久久久久久天堂| 国产精品69精品一区二区三区| 国产一区二区三区在线观看精品| 国产xxxxxxxxx| xx免费视频| 免费一级黄色录像| 老司机福利在线观看| 中文字幕在线观看日韩| 久久在线精品视频| 亚洲精品一线二线三线| 手机看片1024国产| 欧美日韩高清一区二区| 日本免费久久高清视频| 在线观看免费看片| 日本www高清视频| 日本xxxx免费| 国产亚洲高清视频| 成人综合婷婷国产精品久久蜜臀| 国产乱真实合集| 黄网站在线观看高清免费| 天天操夜夜骑| 蜜桃色永久入口| 亚洲欧美偷拍三级| 亚洲麻豆精品| 97超级碰碰人国产在线观看| 亚洲另类色综合网站| 色婷婷av一区二区三区之一色屋| 宅男噜噜99国产精品观看免费| 国产精品偷拍| 激情亚洲小说| 久久一夜天堂av一区二区三区| 精品91福利视频| 中文字幕在线不卡| 大黑人交xxx极品hd| 久久精品国产亚洲7777| 久久久久久久成人| 91精品天堂福利在线观看| 一级片avav网址| 日韩一二三区视频| www.色视频| 欧美日韩国产综合久久| 欧亚一区二区三区| 日韩免费福利视频| 亚洲国产精品麻豆| 日韩精品一页| 日韩电影在线播放| 日韩精品一区二区三区在线播放| 黄网站在线观| 日韩中文不卡| 日产精品高清视频免费| 日韩av电影手机在线| 亚洲 自拍 另类小说综合图区| youjizzxxxx18| 日韩一本大道| 最近中文字幕mv第三季歌词| 好男人香蕉影院| 亚洲中文字幕无码一区| 日韩免费看片| 99精品欧美一区二区蜜桃免费| 国精产品一区一区三区有限在线| 大陆成人av片| 久久综合影视| 性欧美videos高清hd4k| 一区二区精品视频在线观看| 美女一区2区| 成人性生活视频免费看| 国产亚洲高清在线观看| 欧美日韩一级二级| 天海翼在线观看视频| 春意影院普通入口| 九色porny自拍视频| 99久久精品国产一区二区三区| julia中文字幕久久亚洲蜜臀| 国产成人综合美国十次| 欧美激情2020午夜免费观看| 欧美夫妻性生活视频| 欧美三级蜜桃2在线观看| 男人的天堂av高清在线| 中文字幕日韩欧美精品高清在线| 成人激情文学综合网| 亚洲欧美二区三区| 69成人在线| 亚洲欧美韩国| 神马久久精品| 手机在线观看毛片| 亚洲四虎影院| 91精品在线国产| 无码人妻精品一区二区蜜桃百度| 成人台湾亚洲精品一区二区| 日韩欧美精品一区二区三区经典| 大肉大捧一进一出好爽动态图| 天天摸天天操天天干| 亚洲电影一级片| 国产精品性做久久久久久| 亚洲国产美国国产综合一区二区| 黄色av网址在线观看| 黄色在线视频观看网站| 日韩视频一区二区| 丰满少妇在线观看资源站| 亚洲天堂久久久| 亚洲精品天堂在线观看| 97精品国产一区二区三区| 日韩亚洲欧美中文三级| 一本色道久久亚洲综合精品蜜桃| 国产欧美精品xxxx另类| 欧美精品一区男女天堂| 成人综合专区| 国内小视频在线看| 免费在线观看的黄色网址| 亚洲日本中文字幕免费在线不卡| 日本高清不卡在线| 亚洲国产高清在线| 波多野结衣一区二区三区四区| 一区二区三区在线看| 日本中文字幕高清| 亚洲欧美清纯在线制服| 国产亚洲欧洲一区高清在线观看| 中文字幕av一区二区三区| 国产在线观看一区二区| 欧美日韩成人影院| 中文字幕一区二区三区四区欧美| 久久这里有精品视频| 人人干人人插| 久久久精品国产一区二区三区| 香蕉视频免费看| 亚洲free性xxxx护士hd| 久久网福利资源网站| 51国偷自产一区二区三区的来源| 日韩视频一区在线| 91精品国产乱码久久| www.com毛片| 欧美日韩视频在线第一区| 波多野结衣中文字幕一区二区三区| 成年人深夜视频| 啊啊啊好爽视频| 国产一级精品在线| 久久人体做爰大胆| 色狠狠久久aa北条麻妃| 日韩av专区| 精品人妻二区中文字幕| 日本一二区视频| 日韩av电影在线免费播放| 黄色在线免费观看| 最新av免费在线观看| 成人动漫视频| 久久久久久久久网| 国内自拍一区| 亚洲第一会所| 5566成人精品视频免费| 欧美日韩成人在线播放| 黄色国产精品视频| 欧美精品欧美精品| 免费在线黄网| 久久丁香四色| 秋霞在线一区二区| 少妇性l交大片| 男人av在线| 亚洲黄色小说视频| 大桥未久一区二区| 九九九精品视频| 天天干天天干天天干天天干天天干| 亚洲人亚洲人成电影网站色| 欧美色图一区二区三区| 免费在线观看成人av| 亚洲国产日韩在线一区模特| 日韩精品一区二区在线观看| 伊人福利在线| 免费成人黄色大片| 欧美日韩中文字幕日韩欧美| 99精品视频中文字幕| 国产原创精品| 91大神福利视频在线| 国产精品日韩久久久久| 最近免费中文字幕大全免费版视频| 欧美激情xxxx| 看欧美ab黄色大片视频免费| 国产亚洲人成a一在线v站| 免费 成 人 黄 色| 欧美高清3dfreexxxx性| 日韩精品在线播放视频| 免费免费啪视频在线观看| 欧美亚洲国产bt| 日本视频一区二区不卡| 成人福利视频在| 欧美成人精品不卡视频在线观看| 黄网站欧美内射| 亚洲一区二区三区四区av| 亚洲午夜久久久久久久久久久| 美女福利视频网| hitomi一区二区三区精品| 黄色激情在线播放| 日本成人动漫在线观看| 亚洲视频综合网| 国产精品99一区二区| 91福利免费观看| 中文字幕日韩精品久久| 992tv在线观看| 四色永久免费网站| 亚洲综合激情在线| 精品国产亚洲一区二区在线观看| ㊣最新国产の精品bt伙计久久| 中文字幕永久免费| 欧美大胆一级视频| 黄色免费观看视频网站| 欧美第一区第二区| 成年人三级视频| jvid福利在线一区二区| 国产一区二区主播在线| 亚洲免费视频播放| 欧美日精品一区视频| 中文字幕人成一区| 一区二区三区免费在线视频| 色视频www在线播放国产| 97中文在线| 亚洲制服丝袜av| 超碰激情在线| 亚洲蜜桃精久久久久久久| 91好色先生tv| 小说区乱图片区| 狠狠操视频网站| 国产精品入口麻豆免费| 国产视频三区四区| 人人妻人人添人人爽欧美一区| 99久久夜色精品国产亚洲1000部| av有声小说一区二区三区| 欧美日韩一区二区综合| 欧美一区二区三区系列电影| 久久伊伊香蕉| 久久视频在线视频|