成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁(yè) > 知識(shí)庫(kù) > Python爬蟲(chóng)之自動(dòng)爬取某車(chē)之家各車(chē)銷(xiāo)售數(shù)據(jù)

Python爬蟲(chóng)之自動(dòng)爬取某車(chē)之家各車(chē)銷(xiāo)售數(shù)據(jù)

熱門(mén)標(biāo)簽:地圖標(biāo)注面積 所得系統(tǒng)電梯怎樣主板設(shè)置外呼 市場(chǎng)上的電銷(xiāo)機(jī)器人 北京電銷(xiāo)外呼系統(tǒng)加盟 佛山400電話辦理 朝陽(yáng)手機(jī)外呼系統(tǒng) 儋州電話機(jī)器人 小蘇云呼電話機(jī)器人 北瀚ai電銷(xiāo)機(jī)器人官網(wǎng)手機(jī)版

一、目標(biāo)網(wǎng)頁(yè)分析

目標(biāo)網(wǎng)站是某車(chē)之家關(guān)于品牌汽車(chē)車(chē)型的口碑模塊相關(guān)數(shù)據(jù),比如我們演示的案例奧迪Q5L的口碑頁(yè)面如下:

https://k.autohome.com.cn/4851/#pvareaid=3311678

為了演示方式,大家可以直接打開(kāi)上面這個(gè)網(wǎng)址,然后拖到全部口碑位置,找到我們本次采集需要的字段如下圖所示:

采集字段

我們進(jìn)行翻頁(yè)發(fā)現(xiàn),瀏覽器網(wǎng)址發(fā)生了變化,大家可以對(duì)下如下幾頁(yè)的網(wǎng)址找出規(guī)律:

https://k.autohome.com.cn/4851/index_2.html#dataList
https://k.autohome.com.cn/4851/index_3.html#dataList
https://k.autohome.com.cn/4851/index_4.html#dataList

對(duì)于上面寫(xiě)網(wǎng)址,我們發(fā)現(xiàn)可變部分是車(chē)型(如4851)以及頁(yè)碼(如2,3,4),于是我們可以構(gòu)建url參數(shù)如下:

# typeid是車(chē)型,page是頁(yè)碼
url = f'https://k.autohome.com.cn/{typeid}/index_{page}.html#dataList'

二、數(shù)據(jù)請(qǐng)求

通過(guò)簡(jiǎn)單的測(cè)試,發(fā)現(xiàn)似乎不存在反爬,那就簡(jiǎn)單了。

我們先引入需要用到的庫(kù):

import requests
import pandas as pd
import html
from lxml import etree
import re

然后創(chuàng)建一個(gè)數(shù)據(jù)請(qǐng)求的函數(shù)備用:

# 獲取網(wǎng)頁(yè)數(shù)據(jù)(傳遞參數(shù) 車(chē)型typeid和頁(yè)碼數(shù))
def get_html(typeid,page):
    # 組合出請(qǐng)求地址
    url = f'https://k.autohome.com.cn/{typeid}/index_{page}.html#dataList'
    # 請(qǐng)求數(shù)據(jù)(因?yàn)闆](méi)有反爬,這里沒(méi)有設(shè)置請(qǐng)求頭和其他參數(shù))
    r = requests.get(url)
    # 請(qǐng)求的網(wǎng)頁(yè)數(shù)據(jù)中有網(wǎng)頁(yè)特殊字符,通過(guò)以下方法進(jìn)行解析
    r = html.unescape(r.text)
    # 返回網(wǎng)頁(yè)數(shù)據(jù)
    return r

請(qǐng)求來(lái)的數(shù)據(jù)就是網(wǎng)頁(yè)html文本,我們接下來(lái)采用re解析出一共多少頁(yè)碼,再用xpath進(jìn)行采集字段的解析。

三、數(shù)據(jù)解析

由于需要進(jìn)行翻頁(yè),這里我們可以先通過(guò)re正則表達(dá)式獲取總頁(yè)碼。通過(guò)查看網(wǎng)頁(yè)數(shù)據(jù),我們發(fā)現(xiàn)總頁(yè)碼可以通過(guò)如下方式獲?。?/p>

try:
    pages = int(re.findall(r'共(\d+)頁(yè)',r)[0])
# 如果請(qǐng)求不到頁(yè)數(shù),則表示該車(chē)型下沒(méi)有口碑?dāng)?shù)據(jù)
except :
    print(f'{name} 沒(méi)有數(shù)據(jù)!')
    continue

總頁(yè)碼采集

關(guān)于待采集字段信息,我們發(fā)現(xiàn)都在節(jié)點(diǎn)div[@class="mouthcon-cont-left"]里,可以先定位這個(gè)節(jié)點(diǎn)數(shù)據(jù),然后再進(jìn)行逐一解析。

待采集字段信息所在節(jié)點(diǎn)

此外,我們發(fā)現(xiàn)每一頁(yè)最多15個(gè)車(chē)型口碑?dāng)?shù)據(jù),因此我們每頁(yè)可以定位15個(gè)待采集信息數(shù)據(jù)集,遍歷采集代碼:

divs = r_html.xpath('.//div[@class="mouthcon-cont-left"]')
# 遍歷每個(gè)全部的車(chē)輛銷(xiāo)售信息
for div in divs:
    # 找到車(chē)輛銷(xiāo)售信息所在的地方
    mt = div.xpath('./div[@class="choose-con mt-10"]')[0]
    # 找到所需字段
    infos = mt.xpath('./dl[@class="choose-dl"]')
    # 設(shè)置空的字典,用于存儲(chǔ)單個(gè)車(chē)輛信息
    item = {}
    # 遍歷車(chē)輛信息字段
    for info in infos:
        key = info.xpath('.//dt/text()')[0]
        # 當(dāng)字段為購(gòu)買(mǎi)車(chē)型時(shí),進(jìn)行拆分為車(chē)型和配置
        if key == '購(gòu)買(mǎi)車(chē)型':
            item[key] = info.xpath('.//dd/a/text()')[0]
            item['購(gòu)買(mǎi)配置'] = info.xpath('.//span[@class="font-arial"]/text()')[0]
        # 當(dāng)字段為購(gòu)車(chē)經(jīng)銷(xiāo)商時(shí),需要獲取經(jīng)銷(xiāo)商的id參數(shù),再調(diào)用api獲取其真實(shí)經(jīng)銷(xiāo)商信息(這里有坑)
        elif key == '購(gòu)車(chē)經(jīng)銷(xiāo)商':
            # 經(jīng)銷(xiāo)商id參數(shù)
            經(jīng)銷(xiāo)商id = info.xpath('.//dd/a/@data-val')[0] +','+ info.xpath('.//dd/a/@data-evalid')[0]
            # 組合經(jīng)銷(xiāo)商信息請(qǐng)求地址
            jxs_url = base_jxs_url+經(jīng)銷(xiāo)商id+'|'
            # 請(qǐng)求數(shù)據(jù)(為json格式)
            data = requests.get(jxs_url)
            j = data.json()
            # 獲取經(jīng)銷(xiāo)商名稱
            item[key] = j['result']['List'][0]['CompanySimple']
        else:
            # 其他字段時(shí),替換轉(zhuǎn)義字符和空格等為空
            item[key] = info.xpath('.//dd/text()')[0].replace("\r\n","").replace(' ','').replace('\xa0','')

四、數(shù)據(jù)存儲(chǔ)

由于沒(méi)啥反爬,這里直接將采集到的數(shù)據(jù)轉(zhuǎn)化為pandas.DataFrame類(lèi)型,然后存儲(chǔ)為xlsx文件即可。

df = pd.DataFrame(items)
df = df[['購(gòu)買(mǎi)車(chē)型', '購(gòu)買(mǎi)配置', '購(gòu)買(mǎi)地點(diǎn)', '購(gòu)車(chē)經(jīng)銷(xiāo)商', '購(gòu)買(mǎi)時(shí)間', '裸車(chē)購(gòu)買(mǎi)價(jià)']]
# 數(shù)據(jù)存儲(chǔ)在本地
df.to_excel(r'車(chē)輛銷(xiāo)售信息.xlsx',index=None,sheet_name='data')

五、采集結(jié)果預(yù)覽

整個(gè)爬蟲(chóng)過(guò)程比較簡(jiǎn)單,采集下來(lái)的數(shù)據(jù)也比較規(guī)范,以本文案例奧迪Q5L示例如下:

到此這篇關(guān)于Python爬蟲(chóng)之自動(dòng)采集某車(chē)之家各車(chē)銷(xiāo)售數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Python采集汽車(chē)銷(xiāo)售數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python腳本實(shí)現(xiàn)自動(dòng)登錄校園網(wǎng)
  • python自動(dòng)化運(yùn)維之Telnetlib的具體使用
  • 還在手動(dòng)蓋樓抽獎(jiǎng)?教你用Python實(shí)現(xiàn)自動(dòng)評(píng)論蓋樓抽獎(jiǎng)(一)
  • Python 如何實(shí)現(xiàn)文件自動(dòng)去重
  • python趣味挑戰(zhàn)之爬取天氣與微博熱搜并自動(dòng)發(fā)給微信好友
  • python 利用PyAutoGUI快速構(gòu)建自動(dòng)化操作腳本
  • Python實(shí)現(xiàn)智慧校園自動(dòng)評(píng)教全新版

標(biāo)簽:云南 江蘇 酒泉 龍巖 寧夏 商丘 金融催收 定西

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python爬蟲(chóng)之自動(dòng)爬取某車(chē)之家各車(chē)銷(xiāo)售數(shù)據(jù)》,本文關(guān)鍵詞  Python,爬蟲(chóng),之,自動(dòng),爬取,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python爬蟲(chóng)之自動(dòng)爬取某車(chē)之家各車(chē)銷(xiāo)售數(shù)據(jù)》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于Python爬蟲(chóng)之自動(dòng)爬取某車(chē)之家各車(chē)銷(xiāo)售數(shù)據(jù)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    国产精品久久久久久久久免费丝袜| 亚洲人成无码网站久久99热国产| 国产免费999| 久久9999免费视频| 最近日韩免费视频| 五月天婷婷在线视频| 最近最好的中文字幕2019免费| 国产精品青草综合久久久久99| 国产福利91精品一区| 亚洲丝袜精品丝袜在线| 在线观看亚洲欧美| 亚洲女厕所小便bbb| 99久久久精品免费观看国产蜜| 成人福利网站在线观看| 后进极品白嫩翘臀在线播放| 久久午夜国产精品| 亚欧美中日韩视频| 久久久久北条麻妃免费看| 亚洲天堂av线| 日韩无码精品一区二区| 精品国产一区二区三区四区| 亚洲第一区第一页| 久久视频免费| 一区二区久久精品66国产精品| 国产精品久久久久久超碰| 日韩精品一区二区免费| 超碰免费在线播放| 欧美精品自拍| 成年人视频观看| 青青草在线观看视频| 欧美日韩在线播| 亚洲一区二区在线观| 国产成人精彩在线视频九色| 同心难改在线观看| 国产最新网站| 亚洲电影成人av99爱色| 国产精品视频一区视频二区| 欧美日韩一区二区国产| 国产伦精品一区二区免费| 无码国模国产在线观看| 日韩精品视频在线看| 日韩中文字幕久久久经典网| 最近更新的2019中文字幕| 亚洲精品国产a久久久久久| 日韩精品卡一| 国产男女激情视频| 欧美系列亚洲系列| 亚洲AV无码一区二区三区少妇| 久久亚洲精品小早川怜子| 在线播放国产一区二区三区| 国产精品久久久久久一区二区三区| 亚洲在线日韩| 国产精品调教视频| 成人国产精品免费观看动漫| 黄色正能量网站| 国产国产精品| 国产精品女同一区二区三区| 91精品久久久久久久蜜月| 中文字幕不卡三区视频| 欧美少妇一级片| 亚洲天堂资源| 久久6免费高清热精品| 久久精品久久99精品久久| 免费看的黄色录像| 四虎永久免费观看| 日韩久久久久久久久久久久久| 中文字幕在线看高清电影| 国产欧美三级电影| 国产精品亚洲一区二区三区在线| 高清国语自产在线观看| 色播五月综合网| 91精品啪在线观看国产81旧版| 久久综合九色综合久| a天堂中文在线官网在线| 日韩免费av片在线观看| 国产精品影院在线观看| 日韩欧美中文字幕不卡| 国产亚洲欧美精品久久久久久| 网址你懂得在线观看| 五月天婷婷网站| 日韩精品极品在线观看播放免费视频| 极品美妇后花庭翘臀娇吟小说| 91精品久久久久久| a∨色狠狠一区二区三区| 奇米影视第四色777| 中文字幕视频在线免费观看| 色欧美激情视频在线| 粉嫩av一区二区三区免费野| 青青久在线视频免费观看| 欧美性高清videossexo| 亚洲网站三级| 免费毛片在线播放免费| 日韩国产欧美视频| 国产在线精品91| 国产调教精品| 欧美理论电影大全| 天堂av在线免费| 欧美在线www| 国产精品极品美女粉嫩高清在线| 特大黑人娇小亚洲女mp4| 忘忧草在线www成人影院| 69国产精品视频免费观看| 欧美私人免费视频| 成人精品电影| 蜜桃av噜噜一区| 亚洲午夜精品久久久久久久久久久久| 中文字幕导航| 国产成人香蕉在线视频fuz| 国产欧美一区二区在线观看| 欧美精品亚洲精品| 亚洲国产福利视频| 三级在线免费观看| 亚洲色图15p| 欧美日韩国产影片| 国产成人精品在线播放| 亚洲图区综合网| 国产精品99蜜臀久久不卡二区| 日韩精品一区二区在线视频| 999国产精品亚洲77777| 1769国内精品视频在线播放| 免费精品视频一区二区三区| 亚洲av电影一区| 天天干天天干天天干天天干天天干| 美女av免费观看| 亚洲特级毛片| 国产精品成人一区二区三区吃奶| 欧美自拍偷拍网| 色偷偷网友自拍| 天堂网视频在线观看| 欧美日韩亚洲系列| 久久69精品久久久久久久电影好| 国产午夜精品福利视频| 成人视屏免费看| 国产又色又爽又高潮免费| 国产伦精品一区二区三区妓女| 一二三四区在线| 国产毛片在线视频| 中文字幕无线精品亚洲乱码一区| 欧洲精品久久久| 国外成人福利视频| 深夜福利一区二区| 久久精品道一区二区三区| 我要看黄色一级片| 99热精品在线观看| 国产偷国产偷亚洲高清人白洁| 国产内射老熟女aaaa∵| 色之综合天天综合色天天棕色| 精品视频在线一区| 亚洲欧美日韩一区在线| 水莓100在线视频| 99在线欧洲视频| 国产欧美一区二区三区久久| 亚洲一区二区黄色| 视频在线日韩| 亚洲免费在线视频一区 二区| 秋霞网一区二区三区| 国语自产精品视频在线看抢先版图片| 欧美男女性生活在线直播观看| 国产精品三级美女白浆呻吟| 欧美网色网址| 日本中文字幕成人| 欧美另类第一页| 国产精品毛片久久久久久久久久99999999| 中文字幕av高清在线观看| 亚洲国产精品麻豆| 嫩草影院2018| 天堂va蜜桃一区二区三区| 91网址在线看| 欧美一区二区三区人| 国产精品不卡一区二区三区| 香蕉视频免费看| 国产一区二区三区视频| 亚洲欧美日本韩国| 欧美精品亚洲精品| 日本网站在线免费观看| 日韩av不卡在线观看| 天天影视色香欲综合| 精品69视频一区二区三区| 久久精品人人做人人爽电影蜜月| 久久精品国产99久久6| 欧美成人亚洲成人日韩成人| 日韩成人久久| 成人美女免费网站视频| 欧美日韩在线视频一区二区| 天堂蜜桃91精品| 欧美成人一级视频| 日韩欧美电影| 亚洲毛片欧洲毛片国产一品色| 激情六月综合| 午夜精品123| 国产成人无码一区二区在线播放| 亚洲自拍一区在线观看| 色综合久久精品亚洲国产| 91视频-88av| 韩国中文字幕av| 综合国产精品久久久| 久久精品国产亚洲高清剧情介绍| 7m精品国产导航在线| 欧美日韩一区二| 区二区三区在线| 午夜免费在线观看精品视频| 日韩高清不卡av| 青草视频在线免费直播| 欧美日韩亚洲国产综合| 亚洲乱码国产乱码精品精的特点| 男人av资源站| 久久久久国内| 国产麻豆视频免费观看| 久久精品免费播放| 日韩精彩视频在线观看| 一色桃子久久精品亚洲| 爆操妹子视频在线观看| 国产无遮挡又黄又爽免费软件| 国产精品久久久久久久久快鸭| 久久99久久99精品| 一级在线免费观看| 捷克做爰xxxⅹ性视频| 国产激情一区二区三区在线观看| 亚洲欧洲一区二区福利| 国产精品免费观看久久| 亚洲天堂av影院| 亚洲国产精品推荐| 日韩一区二区三区在线看| 女同性一区二区三区人了人一| 久久丁香综合五月国产三级网站| 亚洲成人电视网| 亚洲欧美日韩综合在线| 国产成人禁片免费观看| 污污片在线免费视频| 老司机午夜在线视频| 精品欧美日韩一区二区| 91片黄在线观看喷潮| 国产精品作爱| 国产精品久久久久aaaa九色| 国产探花一区在线观看| 91福利视频网站| 红杏一区二区三区| 波多野结衣二区三区| 免费不卡中文字幕在线| 一区二区在线观看视频在线观看| 久久男女视频| 国产又爽又黄又刺激的软件| yourporn在线观看中文站| av在线播放天堂| www..69.hd| 熟女人妻一区二区三区免费看| 亚洲国产日韩一区| 国产又猛又粗| 激情综合视频| 精品久久久久一区二区国产| 日日狠狠久久偷偷综合色| 日韩欧美在线一区二区三区| 男女精品视频| 蜜臀av在线| 最新欧美精品一区二区三区| 久久久亚洲欧洲日产国码αv| 91网站最新网址| 亚洲天堂2018av| 欧美性xxxx69| 中文精品视频一区二区在线观看| 久久成人国产精品入口| 亚洲国产精品精华液网站| 天天操天天插天天射| 亚州av中文字幕在线免费观看| 五月婷婷之综合激情| 91精品婷婷国产综合久久性色| 日韩在线免费视频观看| 欧美成人性色生活仑片| 99久久夜色精品国产亚洲1000部| 国产伦精品一区二区三区照片| 欧美视频1区| 青草国产精品久久久久久| 欧美草草影院在线视频| 国产呻吟对白刺激无套视频在线| 337p日本欧洲亚洲大胆精品| 精品国产免费人成网站| 欧美一级特黄aaaaaa大片在线观看| www.99视频| 欧美在线观看一二区| 大地资源中文在线观看免费版| 小水嫩精品福利视频导航| 国产+成+人+亚洲欧洲| 日韩高清人体午夜| 区一区二日本| 欧美97人人模人人爽人人喊视频| 波多野结衣50连登视频| 中文字字幕在线观看| 欧美激情网友自拍| 国产一区二区伦理| 伊人色综合久久天天| 91尤物国产福利在线观看| 日本一区二区三区在线观看视频| 在线影院自拍| 99在线观看免费| 亚洲国产精品久久久久久久| 天天综合色天天综合色hd| 激情综合网五月| 久久久久久这里只有精品| 99久久精品免费看国产交换| 伊人久久99| 在线看的毛片| 不卡av日日日| 91精品国产综合久久久久久| 一个色综合网站| 亚洲综合精品自拍| 久久青草国产手机看片福利盒子| 成人全视频免费观看在线看| 热久久免费视频| 性生交大片免费全黄| 成年人视频大全| 色88888久久久久久影院按摩| 精品人妻一区二区三区四区不卡| 人人玩人人添人人澡免费| 久操成人av| 欧美日韩一区二区三区免费看| 欧美精品电影| 亚洲2020天天堂在线观看| 中文字幕欧美激情| 亚洲国产精品日韩专区av有中文| 久久av老司机精品网站导航| 久久久精品一区二区涩爱| 欧美精品九九99久久| 日韩有码在线电影| 性色av一区二区三区免费| 福利一区视频在线观看| 男女爱爱免费网站| 亚洲毛片一区二区| caoliu在线|