成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識庫 > python爬蟲框架feapder的使用簡介

python爬蟲框架feapder的使用簡介

熱門標簽:地圖標注的意義點 房產(chǎn)電銷外呼系統(tǒng) 315電話機器人廣告 上海機器人外呼系統(tǒng)哪家好 浙江電銷卡外呼系統(tǒng)好用嗎 南京銷售外呼系統(tǒng)軟件 地圖標注微信發(fā)送位置不顯示 地圖制圖標注位置改變是移位嗎 蓋州市地圖標注

1. 前言

大家好,我是安果!

眾所周知,Python 最流行的爬蟲框架是 Scrapy,它主要用于爬取網(wǎng)站結構性數(shù)據(jù)

今天推薦一款更加簡單、輕量級,且功能強大的爬蟲框架:feapder

項目地址:

https://github.com/Boris-code/feapder

2. 介紹及安裝

和 Scrapy 類似,feapder 支持輕量級爬蟲、分布式爬蟲、批次爬蟲、爬蟲報警機制等功能

內(nèi)置的 3 種爬蟲如下:

  • AirSpider

輕量級爬蟲,適合簡單場景、數(shù)據(jù)量少的爬蟲

  • Spider

分布式爬蟲,基于 Redis,適用于海量數(shù)據(jù),并且支持斷點續(xù)爬、自動數(shù)據(jù)入庫等功能

  • BatchSpider

分布式批次爬蟲,主要用于需要周期性采集的爬蟲

在實戰(zhàn)之前,我們在虛擬環(huán)境下安裝對應的依賴庫

# 安裝依賴庫
pip3 install feapder

3. 實戰(zhàn)一下

我們以最簡單的 AirSpider 來爬取一些簡單的數(shù)據(jù)

目標網(wǎng)站:aHR0cHM6Ly90b3BodWIudG9kYXkvIA==

詳細實現(xiàn)步驟如下( 5 步)

3-1  創(chuàng)建爬蟲項目

首先,我們使用「 feapder create -p 」命令創(chuàng)建一個爬蟲項目

# 創(chuàng)建一個爬蟲項目
feapder create -p tophub_demo

3-2  創(chuàng)建爬蟲 AirSpider

命令行進入到 spiders 文件夾目錄下,使用「 feapder create -s 」命令創(chuàng)建一個爬蟲

cd spiders

# 創(chuàng)建一個輕量級爬蟲
feapder create -s tophub_spider 1

其中

  • 1 為默認,表示創(chuàng)建一個輕量級爬蟲 AirSpider
  • 2 代表創(chuàng)建一個分布式爬蟲 Spider
  • 3 代表創(chuàng)建一個分布式批次爬蟲 BatchSpider

3-3  配置數(shù)據(jù)庫、創(chuàng)建數(shù)據(jù)表、創(chuàng)建映射 Item

以 Mysql 為例,首先我們在數(shù)據(jù)庫中創(chuàng)建一張數(shù)據(jù)表

# 創(chuàng)建一張數(shù)據(jù)表
create table topic
(
    id         int auto_increment
        primary key,
    title      varchar(100)  null comment '文章標題',
    auth       varchar(20)   null comment '作者',
    like_count     int default 0 null comment '喜歡數(shù)',
    collection int default 0 null comment '收藏數(shù)',
    comment    int default 0 null comment '評論數(shù)'
);

然后,打開項目根目錄下的 settings.py 文件,配置數(shù)據(jù)庫連接信息

# settings.py

MYSQL_IP = "localhost"
MYSQL_PORT = 3306
MYSQL_DB = "xag"
MYSQL_USER_NAME = "root"
MYSQL_USER_PASS = "root"

最后,創(chuàng)建映射 Item( 可選 )

進入到 items 文件夾,使用「 feapder create -i 」命令創(chuàng)建一個文件映射到數(shù)據(jù)庫

PS:由于 AirSpider 不支持數(shù)據(jù)自動入庫,所以這步不是必須

3-4  編寫爬蟲及數(shù)據(jù)解析

第一步,首先使「 MysqlDB 」初始化數(shù)據(jù)庫

from feapder.db.mysqldb import MysqlDB

class TophubSpider(feapder.AirSpider):

    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.db = MysqlDB()

第二步,在 start_requests 方法中,指定爬取主鏈接地址,使用關鍵字「download_midware 」配置隨機 UA

import feapder
from fake_useragent import UserAgent

def start_requests(self):
    yield feapder.Request("https://tophub.today/", download_midware=self.download_midware)

def download_midware(self, request):
    # 隨機UA
    # 依賴:pip3 install fake_useragent
    ua = UserAgent().random
    request.headers = {'User-Agent': ua}
    return request

第三步,爬取首頁標題、鏈接地址

使用 feapder 內(nèi)置方法 xpath 去解析數(shù)據(jù)即可

def parse(self, request, response):
    # print(response.text)
    card_elements = response.xpath('//div[@class="cc-cd"]')

    # 過濾出對應的卡片元素【什么值得買】
    buy_good_element = [card_element for card_element in card_elements if
                        card_element.xpath('.//div[@class="cc-cd-is"]//span/text()').extract_first() == '什么值得買'][0]

    # 獲取內(nèi)部文章標題及地址
    a_elements = buy_good_element.xpath('.//div[@class="cc-cd-cb nano"]//a')

    for a_element in a_elements:
        # 標題和鏈接
        title = a_element.xpath('.//span[@class="t"]/text()').extract_first()
        href = a_element.xpath('.//@href').extract_first()

        # 再次下發(fā)新任務,并帶上文章標題
        yield feapder.Request(href, download_midware=self.download_midware, callback=self.parser_detail_page,
                              title=title)

第四步,爬取詳情頁面數(shù)據(jù)

上一步下發(fā)新的任務,通過關鍵字「 callback 」指定回調(diào)函數(shù),最后在 parser_detail_page 中對詳情頁面進行數(shù)據(jù)解析

def parser_detail_page(self, request, response):
    """
    解析文章詳情數(shù)據(jù)
    :param request:
    :param response:
    :return:
    """
    title = request.title

    url = request.url

    # 解析文章詳情頁面,獲取點贊、收藏、評論數(shù)目及作者名稱
    author = response.xpath('//a[@class="author-title"]/text()').extract_first().strip()

    print("作者:", author, '文章標題:', title, "地址:", url)

    desc_elements = response.xpath('//span[@class="xilie"]/span')

    print("desc數(shù)目:", len(desc_elements))

    # 點贊
    like_count = int(re.findall('\d+', desc_elements[1].xpath('./text()').extract_first())[0])
    # 收藏
    collection_count = int(re.findall('\d+', desc_elements[2].xpath('./text()').extract_first())[0])
    # 評論
    comment_count = int(re.findall('\d+', desc_elements[3].xpath('./text()').extract_first())[0])

    print("點贊:", like_count, "收藏:", collection_count, "評論:", comment_count)

3-5  數(shù)據(jù)入庫

使用上面實例化的數(shù)據(jù)庫對象執(zhí)行 SQL,將數(shù)據(jù)插入到數(shù)據(jù)庫中即可

# 插入數(shù)據(jù)庫
sql = "INSERT INTO topic(title,auth,like_count,collection,comment) values('%s','%s','%s','%d','%d')" % (
title, author, like_count, collection_count, comment_count)

# 執(zhí)行
self.db.execute(sql)

4. 最后

本篇文章通過一個簡單的實例,聊到了 feapder 中最簡單的爬蟲 AirSpider

關于 feapder 高級功能的使用,后面我將會通過一系列實例進行詳細說明

源碼地址:https://github.com/xingag/spider_python/tree/master/feapder

以上就是python爬蟲框架feapder的使用簡介的詳細內(nèi)容,更多關于python爬蟲框架feapde的資料請關注腳本之家其它相關文章!

您可能感興趣的文章:
  • 上手簡單,功能強大的Python爬蟲框架——feapder
  • Python爬蟲框架之Scrapy中Spider的用法
  • Python爬蟲框架-scrapy的使用
  • 一文讀懂python Scrapy爬蟲框架
  • python Scrapy爬蟲框架的使用
  • 詳解Python的爬蟲框架 Scrapy
  • python3 Scrapy爬蟲框架ip代理配置的方法
  • Python使用Scrapy爬蟲框架全站爬取圖片并保存本地的實現(xiàn)代碼
  • Python爬蟲框架Scrapy實例代碼
  • Python之Scrapy爬蟲框架安裝及簡單使用詳解
  • 爬蟲框架 Feapder 和 Scrapy 的對比分析

標簽:克拉瑪依 雙鴨山 貴州 陽泉 赤峰 臨汾 金華 日照

巨人網(wǎng)絡通訊聲明:本文標題《python爬蟲框架feapder的使用簡介》,本文關鍵詞  python,爬蟲,框架,feapder,的,;如發(fā)現(xiàn)本文內(nèi)容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python爬蟲框架feapder的使用簡介》相關的同類信息!
  • 本頁收集關于python爬蟲框架feapder的使用簡介的相關信息資訊供網(wǎng)民參考!
  • 推薦文章
    77导航福利在线| 国产寡妇亲子伦一区二区| 亚洲成人激情视频| av在线免费观看不卡| 欧美一级日韩一级| 国产欧美一区二区三区不卡高清| 日韩成人av在线播放| 青青免费在线视频| 国产高清在线精品一区二区三区| 国产一区二区三区四区五区入口| 三级网在线观看| 欧美人与性动交α欧美精品济南到| 黄色资源在线观看| 精品网站在线看| 日本精品不卡| 亚洲精品中文字幕乱码三区| 日韩国产一级片| 亚洲精品无码专区| 免费看毛片的网址| 夜夜嗨av禁果av粉嫩avhd| 加勒比成人在线| 91九色美女在线视频| 老司机免费视频| 欧美年轻男男videosbes| 亚洲ⅴ国产v天堂a无码二区| 一道本一区二区| 午夜在线视频| 亚洲日本电影在线| 91高清在线视频| 116极品美女午夜一级| 先锋影音av321| 波多野洁衣一区| 妞干网福利视频| 99精品国产99久久久久久白柏| 性爽视频在线| 黄色成人在线| 国产日韩欧美中文字幕| 好吊视频在线观看| 国产一区二区在线视频播放| 99视频精品全国免费| 国产一二三四五区| 日本天码aⅴ片在线电影网站| 国产综合色精品一区二区三区| 久久国产精品首页| 日韩有码视频在线| 久久青青草综合| 欧美精品色图| 中文字幕亚洲影视| 国产又粗又长免费视频| 麻豆md0077饥渴少妇| 欧美精品免费看| 夜夜躁狠狠躁日日躁2021日韩| 亚洲国产精品无码观看久久| 亚洲二区三区四区| 激情五月婷婷久久| 国产精品电影一区二区三区| 深爱激情综合| 91精品中国老女人| 欧美 日韩 综合| 偷拍中文亚洲欧美动漫| 日产欧产美韩系列久久99| www.久久艹| 国产精品第一视频| 色阁综合伊人av| 天堂va蜜桃一区二区三区| aa成人免费视频| 91天堂在线视频| 中文网丁香综合网| 国产女优在线播放| 亚洲九九在线| 你懂的免费在线观看| 日本欧美黄色片| 亚洲日本欧美在线| 91精品国产乱码久久久张津瑜| 五月婷婷一区二区| 高跟丝袜欧美一区| 亚洲影院在线观看| 中文国语毛片高清视频| 国产激情精品久久久第一区二区| 亚洲精品国产品国语在线| 久久久久久久久久看片| 91在线精品| 欧美床上激情在线观看| 国产一区美女在线| 欧美日韩激情一区二区三区| 在线观看日韩精品视频| 不卡的电视剧免费网站有什么| 国产在线视频网站| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 好吊日免费视频| 国产国语亲子伦亲子| 久久国产电影| 色综合久久综合网| 日韩在线视频一区二区三区| 日本一卡二卡在线播放| 成人mm视频在线观看| 欧美综合自拍| 免费国产黄色网址| 欧美日韩1区| 久久精品九九| 青青草精品视频在线观看| 久草精品在线| 在线免费观看欧美| 国产精品自在欧美一区| 亚洲欧美另类视频| 欧美18av| 日韩美女激情视频| 亚洲精品国产精品国自产| 中文乱码人妻一区二区三区视频| 久草中文视频| 日韩免费性生活视频播放| 中文字幕亚洲一区二区三区| 人人妻人人澡人人爽精品日本| www在线观看免费| 国产精品1区2区3区4区| 国产欧美一区二区白浆黑人| 久久国产精品影片| 久久精品免费在线观看| 欧美jizzhd69巨大| 九九九在线视频| 免费污片软件| 欧美性xxxxx极品少妇| 激情综合激情| 日韩av免费在线播放| 日韩av中文字幕一区二区三区| 国产精品视频在线看| 激情亚洲小说| 国产成人精品免高潮费视频| 亚洲人妻一区二区三区| 天天干夜夜夜操| 中文乱码人妻一区二区三区视频| 成人h视频在线观看| 男女午夜网站| 欧美—级a级欧美特级ar全黄| 日本高清不卡一区二区三| 在线一区二区三区视频| 亚洲电影免费观看高清完整版在线| 18视频免费网址在线观看| 一区二区在线免费看| 2020天天操| 另类欧美日韩国产在线| 欧美二区观看| 亚洲一区二区三区四区中文| 亚洲天堂影视av| 欧美亚洲国产免费| 久久精品国产第一区二区三区| 国产日韩一区二区在线| 色爱综合区网| 蜜桃av在线免费观看| 99亚洲伊人久久精品影院红桃| 亚洲大肥女ass| 欧美午夜理伦三级在线观看| 国产一二三区精品| 国产精品美女在线观看| 国产精品久久久久久人| 国产精品日韩欧美一区二区三区| 第一社区sis001原创亚洲| 91亚洲精品| 国产三级三级看三级| 午夜激情一区二区三区| 久久视频一区二区| 国产精品视频yy9299一区| 亚洲爆乳无码一区二区三区| 亚洲国产成人在线视频| 欧美国产综合一区二区| 欧美视频一区二区三区四区| 久久久国产亚洲精品| 国产亚洲成av人在线观看导航| www.成人69.com| 影音先锋中文字幕一区| 日韩三级小视频| 亚洲视频一区二区免费在线观看| 日韩高清一级片| 香蕉久久精品日日躁夜夜躁| 日韩福利小视频| 色欲AV无码精品一区二区久久| 老汉av免费一区二区三区| 在线播放精品一区二区三区| 偷拍自拍在线| 国产馆手机在线观看| 91麻豆成人久久精品二区三区| 亚洲石原莉奈一区二区在线观看| 国产成人自拍网| 蜜芽在线免费观看| 日日日日人人人夜夜夜2017| 久久网中文字幕| 国产免费黄色网址| 国产精品一区二区三区av| 理论片午午伦夜理片在线播放| 亚洲激情自拍图| 精品人妻少妇嫩草av无码专区| 看黄色免费网站| 手机看片1024久久| 男女全黄做爰文章| 日韩肉感妇bbwbbwbbw| 青青青国产精品一区二区| 日韩影院二区| 日韩成人免费视频| 久久久久久久999精品视频| 麻豆一区二区三区| 777视频在线| 手机在线观看毛片| 精品一区二区三区欧美| 免费看欧美一级片| 国产剧情一区二区| 性一爱一乱一交一视频| 91精品人妻一区二区三区蜜桃2| 久久精品国产一区二区三区免费看| 亚洲永久精品ww.7491进入| 久久精品国产99国产精品| 成人午夜网址| 国产寡妇亲子伦一区二区三区四区| 中文字幕高清在线免费播放| 精品一区二区三区香蕉蜜桃| 欧美天天综合网| 欧洲亚洲国产日韩| 日本一区二区三不卡| 亚洲电影成人成人影院| 亚洲免费三区一区二区| 天堂av免费看| 欧美在线视频免费播放| 国产一区二区在线视频你懂的| 青娱乐在线免费视频| 亚洲黄色视屏| 久久天堂av综合合色| 国产精品水嫩水嫩| 狠狠干五月天| 亚洲在线视频一区| 欧美日韩一视频区二区| 强乱中文字幕av一区乱码| 免费高清av| 成人免费观看视频| 污版网站在线观看| 久久av老司机精品网站导航| 4438x全国最大成人| 欧洲精品一区二区三区久久| 极品美女一区| 中文字幕在线免费视频| 欧洲精品在线一区| 欧美乱妇高清无乱码免费| 一本久道在线| 永久免费在线看片视频| 国产免费毛卡片| 中文字幕在线观看| 国产成人av福利| 亚洲精品一区二区三区影院忠贞| 日韩av中文在线观看| 合欧美一区二区三区| 国产麻豆精品一区二区| 国产精品嫩草av| 欧美日韩在线观看视频| 好吊妞视频一区二区三区| 亚洲激情第一区| 欧美在线视频精品| 久久久久久久久久久久久久免费看| www国产亚洲精品久久麻豆| 欧美在线观看日本一区| 一区二区三区的久久的视频| 私人玩物在线观看| 91亚洲国产成人久久精品网站| 加勒比日本影视| 亚洲天堂网在线观看视频| 91精品国产高清| 亚洲特色特黄| 91免费视频网| 国产精品ⅴa有声小说| 国产三级精品三级在线专区| 中文在线字幕观看| 少妇无码一区二区三区| 国产尤物一区二区在线| 国产一线二线在线观看| 日韩av自拍| 欧美美女视频在线观看| 亚洲成va人在线观看| www日韩中文字幕在线看| 久久久久久夜精品精品免费| 亚洲va中文在线播放免费| 丁香花视频在线观看| 国产成人+综合亚洲+天堂| 亚洲福利一二三区| 色一情一乱一伦一区二区三区丨| 91年精品国产| 人人妻人人澡人人爽| 欧美黄色片免费观看| 国产鲁鲁视频在线观看免费| 日韩一区二区三区色| 欧美在线一区二区三区| 国产av精国产传媒| 精品久久久国产| 日欧美一区二区| 日韩精品一区三区| 日本久久综合| 肉肉视频在线观看| 8x8x视频在线| 51国产偷自视频区视频| 羞羞答答国产精品www一本| 911精品国产| 国产精品77777竹菊影视小说| 视频在线精品一区| 国产精品久久综合青草亚洲AV| 亚洲在线观看视频网站| 国产99午夜精品一区二区三区| 国产成人激情av| 免费av福利在线观看| 国产精品一区二区欧美黑人喷潮水| 麻豆精品视频在线观看| 久久夜色撩人精品| 欧美另类69精品久久久久9999| 亚洲精品电影网在线观看| 精品一区二区三区亚洲| 一个人看的www久久| 欧美性猛交xxxx免费看漫画| 国产精品1区二区.| 欧美性大战xxxxx久久久| 五月天在线免费视频| 欧美特黄一区二区三区| 欧美在线视频播放| 91久久精品一区二区三| 久草久草久草| 国产一区不卡精品| 精品一区二区三区视频在线播放| 黄色网址网站| www.久久久久久| 国产传媒在线| 精品久久中文字幕久久av| 亚洲日本va午夜在线影院| 国产午夜福利一区| 男人的天堂亚洲一区|