成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識庫 > Python scrapy爬取蘇州二手房交易數(shù)據(jù)

Python scrapy爬取蘇州二手房交易數(shù)據(jù)

熱門標(biāo)簽:洪澤縣地圖標(biāo)注 大連crm外呼系統(tǒng) 北京電信外呼系統(tǒng)靠譜嗎 百度地圖標(biāo)注位置怎么修改 無錫客服外呼系統(tǒng)一般多少錢 地圖標(biāo)注視頻廣告 老人電話機(jī)器人 高德地圖標(biāo)注是免費(fèi)的嗎 梅州外呼業(yè)務(wù)系統(tǒng)

一、項(xiàng)目需求

使用Scrapy爬取鏈家網(wǎng)中蘇州市二手房交易數(shù)據(jù)并保存于CSV文件中
要求:
房屋面積、總價(jià)和單價(jià)只需要具體的數(shù)字,不需要單位名稱。
刪除字段不全的房屋數(shù)據(jù),如有的房屋朝向會顯示“暫無數(shù)據(jù)”,應(yīng)該剔除。
保存到CSV文件中的數(shù)據(jù),字段要按照如下順序排列:房屋名稱,房屋戶型,建筑面積,房屋朝向,裝修情況,有無電梯,房屋總價(jià),房屋單價(jià),房屋產(chǎn)權(quán)。

二、項(xiàng)目分析

流程圖


通過控制臺發(fā)現(xiàn)所有房屋信息都在一個(gè)ul中其中每一個(gè)li里存儲一個(gè)房屋的信息。

找了到需要的字段,這里以房屋名稱為例,博主用linux截圖,沒法對圖片進(jìn)行標(biāo)注,這一段就是最中間的“景山玫瑰園” 。
其他字段類似不再一一列舉。
獲取了需要的數(shù)據(jù)后發(fā)現(xiàn)沒有電梯的配備情況,所以需要到詳細(xì)頁也就是點(diǎn)擊標(biāo)題后進(jìn)入的頁面,
點(diǎn)擊標(biāo)題

可以看到里面有下需要的信息。

抓取詳細(xì)頁url

進(jìn)行詳細(xì)頁數(shù)據(jù)分析

找到相應(yīng)的位置,進(jìn)行抓取數(shù)據(jù)。

三、編寫程序

創(chuàng)建項(xiàng)目,不說了。

1.編寫item(數(shù)據(jù)存儲)

import scrapy
class LianjiaHomeItem(scrapy.Item):
     name = scrapy.Field() # 名稱
     type = scrapy.Field()  # 戶型
     area = scrapy.Field()  # 面積
     direction = scrapy.Field()  #朝向
     fitment = scrapy.Field()  # 裝修情況
     elevator = scrapy.Field()  # 有無電梯
     total_price = scrapy.Field()  # 總價(jià)
     unit_price = scrapy.Field()  # 單價(jià)

2.編寫spider(數(shù)據(jù)抓?。?/strong>

from scrapy import Request
from scrapy.spiders import Spider
from lianjia_home.items import LianjiaHomeItem

class HomeSpider(Spider):
    name = "home"
    current_page=1 #起始頁

    def start_requests(self): #初始請求
        url="https://su.lianjia.com/ershoufang/"
        yield Request(url=url)

    def parse(self, response): #解析函數(shù)
        list_selctor=response.xpath("http://li/div[@class='info clear']")
        for one_selector in list_selctor:
            try:
                #房屋名稱
                name=one_selector.xpath("http://div[@class='flood']/div[@class='positionInfo']/a/text()").extract_first()
                #其他信息
                other=one_selector.xpath("http://div[@class='address']/div[@class='houseInfo']/text()").extract_first()
                other_list=other.split("|")
                type=other_list[0].strip(" ")#戶型
                area = other_list[1].strip(" ") #面積
                direction=other_list[2].strip(" ") #朝向
                fitment=other_list[3].strip(" ") #裝修
                price_list=one_selector.xpath("div[@class='priceInfo']//span/text()")
                # 總價(jià)
                total_price=price_list[0].extract()
                # 單價(jià)
                unit_price=price_list[1].extract()

                item=LianjiaHomeItem()
                item["name"]=name.strip(" ")
                item["type"]=type
                item["area"] = area
                item["direction"] = direction
                item["fitment"] = fitment
                item["total_price"] = total_price
                item["unit_price"] = unit_price

            #生成詳細(xì)頁
                url = one_selector.xpath("div[@class='title']/a/@href").extract_first()
                yield Request(url=url,
                              meta={"item":item}, #把item作為數(shù)據(jù)v傳遞
                              callback=self.property_parse) #爬取詳細(xì)頁
            except:
                print("error")

        #獲取下一頁
            self.current_page+=1
            if self.current_page=100:
                next_url="https://su.lianjia.com/ershoufang/pg%d"%self.current_page
                yield Request(url=next_url)


    def property_parse(self,response):#詳細(xì)頁
        #配備電梯
        elevator=response.xpath("http://div[@class='base']/div[@class='content']/ul/li[last()]/text()").extract_first()
        item=response.meta["item"]
        item["elevator"]=elevator
        yield item

3.編寫pipelines(數(shù)據(jù)處理)

import re
from scrapy.exceptions import DropItem
class LianjiaHomePipeline:#數(shù)據(jù)的清洗
    def process_item(self, item, spider):
        #面積
        item["area"]=re.findall("\d+\.?\d*",item["area"])[0] #提取數(shù)字并存儲
        #單價(jià)
        item["unit_price"] = re.findall("\d+\.?\d*", item["unit_price"])[0] #提取數(shù)字并存儲

        #如果有不完全的數(shù)據(jù),則拋棄
        if item["direction"] =="暫無數(shù)據(jù)":
            raise DropItem("無數(shù)據(jù),拋棄:%s"%item)

        return item

class CSVPipeline(object):
    file=None
    index=0 #csv文件行數(shù)判斷
    def open_spider(self,spider): #爬蟲開始前,打開csv文件
        self.file=open("home.csv","a",encoding="utf=8")

    def process_item(self, item, spider):#按要求存儲文件。
        if self.index ==0:
            column_name="name,type,area,direction,fitment,elevator,total_price,unit_price\n"
            self.file.write(column_name)#插入第一行的索引信息
            self.index=1

        home_str=item["name"]+","+item["type"]+","+item["area"]+","+item["direction"]+","+item["fitment"]+","+item["elevator"]+","+item["total_price"]+","+item["unit_price"]+"\n"
        self.file.write(home_str) #插入獲取的信息

        return item

    def close_soider(self,spider):#爬蟲結(jié)束后關(guān)閉csv
        self.file.close()

4.編寫settings(爬蟲設(shè)置)

這里只寫下需要修改的地方

USER_AGENT = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.72 Safari/537.36'
#為裝成瀏覽器
ROBOTSTXT_OBEY = False #不遵循robots協(xié)議
ITEM_PIPELINES = {
    'lianjia_home.pipelines.LianjiaHomePipeline': 300,
    #先進(jìn)行數(shù)字提取
    'lianjia_home.pipelines.CSVPipeline': 400
    #在進(jìn)行數(shù)據(jù)的儲存
    #執(zhí)行順序由后邊的數(shù)字決定
}

這些內(nèi)容在settings有些是默認(rèn)關(guān)閉的,把用來注釋的 # 去掉即可開啟。

5.編寫start(代替命令行)

from scrapy import cmdline

cmdline.execute("scrapy crawl home" .split())

附上兩張結(jié)果圖。

總結(jié)

此次項(xiàng)目新增了簡單的數(shù)據(jù)清洗,在整體的數(shù)據(jù)抓取上沒有增加新的難度。

到此這篇關(guān)于Python scrapy爬取蘇州二手房交易數(shù)據(jù)的文章就介紹到這了,更多相關(guān)scrapy爬取二手房交易數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python手拉手教你爬取貝殼房源數(shù)據(jù)的實(shí)戰(zhàn)教程
  • Python爬蟲之爬取我愛我家二手房數(shù)據(jù)
  • python爬取鏈家二手房的數(shù)據(jù)
  • Python爬蟲之爬取二手房信息
  • 基于python爬取鏈家二手房信息代碼示例
  • python爬蟲 爬取58同城上所有城市的租房信息詳解
  • Python爬蟲入門案例之爬取二手房源數(shù)據(jù)

標(biāo)簽:泉州 怒江 安慶 清遠(yuǎn) 長春 洛陽 吉林 岳陽

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python scrapy爬取蘇州二手房交易數(shù)據(jù)》,本文關(guān)鍵詞  Python,scrapy,爬取,蘇州,二手房,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python scrapy爬取蘇州二手房交易數(shù)據(jù)》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python scrapy爬取蘇州二手房交易數(shù)據(jù)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    日韩av一区二| 精品麻豆一区二区三区| 日本午夜在线亚洲.国产| 性生交免费视频| 亚洲人成在线影院| 九九三级毛片| 久久r这里只有精品| 欧美一区在线直播| 国产麻豆精品一区二区| 国产浴室偷窥在线播放| 91嫩草国产丨精品入口麻豆| 国产精品国产精品国产专区不蜜| se在线视频| 三上悠亚免费在线观看| 国产成人av电影在线观看| 久青青在线观看视频国产| 古典武侠综合av第一页| 激情影院在线观看| 国产精品白丝jk喷水视频一区| 久久精品国产露脸对白| 最近免费中文字幕大全免费版视频| 成人免费淫片视频软件| 番号在线播放| 亚洲精品va在线观看| 色黄视频在线观看| 成人动漫视频在线观看完整版| 国产在线观看免费视频软件| 国产一国产二国产三| 国产高清一区二区| 日韩大片在线永久免费观看网站| 美腿丝袜一区二区三区| 一本到高清视频免费精品| 大奶一区二区三区| 国产精品久久久久久超碰| 日本韩国精品一区二区在线观看| 亚洲伊人影院| 精品一区二区亚洲| 欧美乱人伦中文字幕在线| 亚洲午夜视频在线| 久久精品国产99国产| 色综合天天视频在线观看| 天天天天天天操| 青青青免费在线| 亚洲色图视频免费播放| 日韩av资源| 2020日本在线视频中文字幕| 亚洲图片欧洲图片av| 欧美色偷偷大香| 91精品产国品一二三产区| 亚洲三区在线观看无套内射| 日本一卡2卡三卡4卡网站| 俄罗斯xxxx性全过程| 日韩欧美国产免费播放| 成人看片黄a免费看在线| 欧美日韩高清一区二区三区| 国产精品扒开腿做爽爽爽的视频| 精品一区二区三区在线成人| 在线观看久久av| 北条麻妃在线观看| 美女xx视频| 欧美在线视频你懂得| 亚洲高清毛片一区二区| jizzjizzjizzjizz日本| 亚洲视频在线看| 夜色77av精品影院| 免费黄色小网站| 欧美性猛交xxxx乱大交蜜桃| 免费在线黄色av| 国产精品拍天天在线| 欧美日韩一区二区三区在线| 国产福利91精品一区二区三区| 欧洲亚洲一区二区三区四区五区| 国产999久久久| 在线天堂www在线国语对白| 亚洲网址在线观看| 日本高清不卡在线观看| 尤物tv国产一区| 九九免费精品视频在线观看| 欧美1—12sexvideos| 亚洲天堂一区二区| 中文字幕乱码一区| 亚洲中文字幕无码一区二区三区| 日韩激情第一页| 嗯啊主人调教在线播放视频| 国产精品日韩精品欧美在线| 国产乱论精品| 黄p免费网站| 久久久国产精华| 国产欧美久久久| 日韩在线观看免费| 最新中文字幕视频| 夜夜嗨av一区二区三区免费区| 欧美日韩另类丝袜其他| 亚洲日本青草视频在线怡红院| 国产精品乱码一区二三区小蝌蚪| 日韩精品导航| 国产在线观看免费av| 欧洲亚洲免费视频| 最新日韩精品| av一本久道久久综合久久鬼色| 在线播放av更多| 免费电影网站在线视频观看福利| 国产美女18xxxx免费视频| 欧洲猛交xxxx乱大交3| 日韩视频亚洲视频| 欧美一区二区三区免费| 中文字幕色av一区二区三区| www.尤物.com| 国产婷婷色一区二区三区| 国产精品麻豆免费版现看视频| 欧美四级电影在线观看| 国产原厂视频在线观看| 老女人性生活视频| 女人18毛片毛片毛片毛片区二| 色黄久久久久久| 国产偷v国产偷v亚洲高清| 欧美中文娱乐网| 欧美久久精品一级c片| 国产精品人人爽人人做我的可爱| 久久久久久亚洲精品杨幂换脸| 91精品国产色综合久久不卡98| 亚洲欧美电影一区二区| 91精品一区二区三区在线观看| 亚洲人午夜射精精品日韩| 视频一区二区三区四区五区| 蜜桃视频一区二区在线观看| 男人的天堂免费| 亚洲黄色av| 九九精品久久久| 激情偷乱视频一区二区三区| 国产精品自产拍在线观| av在线免费播放| 禁断一区二区三区在线| 日本综合在线观看| 亚洲婷婷噜噜| 激情成人中文字幕| 北岛玲日韩精品一区二区三区| 成人看片爽爽爽| 亚洲欧美在线观看视频| 日韩中文字幕国产精品| 国产女人水真多18毛片18精品视频| 日本精品在线视频| 欧美久草视频| 337p日本| 另类图片亚洲另类| 精品国产91| 在线观看一区二区视频| 丝袜在线观看| 日韩网站免费观看高清| 国产特级淫片免费看| 触手亚洲一区二区三区| 在线免费观看av网站| 久久天堂av综合合色蜜桃网| 亚洲国内精品视频| 国内精品视频久久| 少妇人妻大乳在线视频| 日韩电影免费在线观看网站| 在线成人国产| 日韩精品在线一区二区三区| 色一情一乱一乱一区91av| 亚洲va久久久噜噜噜久久天堂| 亚洲福利精品| 天天免费亚洲黑人免费| 免费观看国产精品| 国产精品国产国产aⅴ| 亚洲欧美日韩精品永久在线| 国产精品播放| 天堂免费在线视频| 黄视频网站在线观看| 欧美人xxx| 成人深夜在线观看| jizzjizz欧美69巨大| 中文字幕一区二区在线观看视频| 国产超碰91| 97人妻精品一区二区三区免| 无限资源日本好片| 无套内谢大学处破女www小说| 久久国产日韩欧美| 成av人电影在线观看| 美日韩精品免费| 国产sm在线观看| 欧美一级久久久久久久大片| 四虎影视2018在线播放alocalhost| av在线免费电影| 欧美成人嫩草网站| 成人h片在线播放免费网站| 成人午夜剧场视频网站| 国产精品白丝jk喷水视频一区| 久久久久www| 亚洲男人天堂网址| 亚洲一区二区三区涩| 一区二区视频观看| 欧美娇小性xxxx| 欧美人动性xxxxz0oz| 国产成人av一区二区三区不卡| 中文字幕在线视频网站| 欧美a级大片在线| 草莓视频丝瓜在线观看丝瓜18| 北条麻妃在线观看视频| 91视频 -- 69xx| 国产精品一区二区三区乱码| 日韩av不卡播放| 精品国产免费人成电影在线观...| 欧美在线中文字幕| 欧美一级理论性理论a| 欧美视频在线观看一区二区三区| 欧美日韩极品在线观看一区| 欧美熟乱第一页| 99视频有精品高清视频| gogo亚洲国模私拍人体| 国产在线视频一区二区三区| 日本aa大片在线播放免费看| 日韩在线一区二区三区免费视频| 中文字幕电影一区| 色网站免费观看| 国 产 黄 色 大 片| 国产一二三四区在线观看| 久久久久久久久影视| 国产性猛交xxxx免费看久久| 免费成人看片网址| 欧美国产日韩在线观看成人| 精品国产乱码久久久久久丨区2区| 91极品身材尤物theporn| 久久精品国产精品亚洲毛片| 神马午夜伦理影院| 色琪琪一区二区三区亚洲区| 成人女保姆的销魂服务| 怡红院一区二区| 成人精品国产一区二区4080| 久久亚洲精品视频| 国产欧美日韩亚州综合| 岛国片在线免费观看| 日韩三级免费| 少妇激情av一区二区| 高清福利在线观看| а√天堂8资源在线官网| 久久午夜免费电影| 日韩有码第一页| 国产精品www网站| 国产精选在线视频拍拍拍| 欧美日韩国产bt| 日产欧产va高清| 国产精品男女视频| 实拍女处破www免费看| 国产毛片在线视频| 人人超碰91尤物精品国产| 欧美视频精品在线观看| 人妻无码一区二区三区久久99| 成人午夜视频在线观看| 91黄色小网站| 日韩欧美高清一区二区三区| 成年人网站大全| 五月天男人天堂| 国产一区亚洲| 欧美一区二区人人喊爽| 在线影视一区| 婷婷综合社区| 99热这里只有精品3| 中国黄色片一级| 国产精品中文字幕欧美| 精品人妻一区二区三区蜜桃视频| 尤蜜粉嫩av国产一区二区三区| 中文字幕求饶的少妇| 亚洲精品国产精品国自产观看浪潮| 91麻豆免费观看| 亚洲午夜精品久久久中文影院av| 婷婷综合在线视频| 亚洲视频电影图片偷拍一区| 国产精品亚洲d| 成人一级片在线观看| 美女在线观看视频一区二区| 久久久久99人妻一区二区三区| 精品人妻一区二区三| 中文字幕在线播| 日本激情综合网| 日韩少妇与小伙激情| 国产成人a亚洲精品| 男人日女人bb视频| 热99在线视频| 国内拍拍自拍视频在线观看| 户外露出精品视频国产| 天天综合网天天综合| 成人性色生活片免费看爆迷你毛片| 欧美一区二区三区免费视频| av综合网站| 欧美性xxxx极品高清hd直播| 波多野结衣久草一区| 五月天一区二区三区| 亚洲精品视频在线免费| 巨乳女教师的诱惑| 国产一级片久久| 天天干在线视频论坛| 色yeye免费人成网站在线观看| 国产精品久久久久秋霞鲁丝| 国产欧美精品一区二区色综合| 日韩视频免费在线观看| 国产精品在线| 国产欧美 在线欧美| 国产欧美一区二区三区另类精品| 被灌满精子的波多野结衣| 日韩人妻精品中文字幕| 性欧美大战久久久久久久免费观看| 国精产品一品二品国精品69xx| 精品国模一区二区三区欧美| 日韩和的一区二在线| 欧美专区在线播放| 日本韩国在线不卡| 欧美精品xxxxx| 一区二区三区性视频| 男男一级淫片免费播放| www.欧美com| 男人用机机桶女人| 国产女同无遮挡互慰高潮91| 国产又黄又猛又粗| 欧美婷婷精品激情| 欧美在线精品一区二区三区| 亚洲成人一区在线观看| 国产在线精品一区二区不卡| 免费又黄又爽又猛大片午夜| 亚洲成人18| www.av天天| 欧美电影免费观看完整版| 国产乱子夫妻xx黑人xyx真爽| 亚欧洲精品在线视频免费观看| 日本成人网址| 国产区在线观看| 超碰成人在线免费| 欧美在线综合|