成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁(yè) > 知識(shí)庫(kù) > Requests什么的通通爬不了的Python超強(qiáng)反爬蟲方案!

Requests什么的通通爬不了的Python超強(qiáng)反爬蟲方案!

熱門標(biāo)簽:沈陽(yáng)防封電銷卡品牌 富錦商家地圖標(biāo)注 池州外呼調(diào)研線路 沈陽(yáng)人工外呼系統(tǒng)價(jià)格 江西省地圖標(biāo)注 武漢外呼系統(tǒng)平臺(tái) 外呼系統(tǒng)哪些好辦 如何申請(qǐng)400電話費(fèi)用 沈陽(yáng)外呼系統(tǒng)呼叫系統(tǒng)

一、前言

一個(gè)非常強(qiáng)的反爬蟲方案 —— 禁用所有 HTTP 1.x 的請(qǐng)求!

現(xiàn)在很多爬蟲庫(kù)其實(shí)對(duì) HTTP/2.0 支持得不好,比如大名鼎鼎的 Python 庫(kù) —— requests,到現(xiàn)在為止還只支持 HTTP/1.1,啥時(shí)候支持 HTTP/2.0 還不知道。

Scrapy 框架最新版本 2.5.0(2021.04.06 發(fā)布)加入了對(duì) HTTP/2.0 的支持,但是官網(wǎng)明確提示,現(xiàn)在是實(shí)驗(yàn)性的功能,不推薦用到生產(chǎn)環(huán)境,原文如下:

HTTP/2 support in Scrapy is experimental, and not yet recommended for production environments. Future Scrapy versions may introduce related changes without a deprecation period or warning.

插一句,Scrapy 中怎么支持 HTTP/2.0 呢?在 settings.py 里面換一下 Download Handlers 即可:

DOWNLOAD_HANDLERS = {
    'https': 'scrapy.core.downloader.handlers.http2.H2DownloadHandler',
}

當(dāng)前 Scrapy 的 HTTP/2.0 實(shí)現(xiàn)的已知限制包括:

  • 不支持 HTTP/2.0 明文(h2c),因?yàn)闆](méi)有主流瀏覽器支持未加密的 HTTP/2.0。
  • 沒(méi)有用于指定最大幀大小大于默認(rèn)值 16384 的設(shè)置,發(fā)送更大幀的服務(wù)器的連接將失敗。
  • 不支持服務(wù)器推送。
  • 不支持bytes_received和 headers_received信號(hào)。

關(guān)于其他的一些庫(kù),也不必多說(shuō)了,對(duì) HTTP/2.0 的支持也不好,目前對(duì) HTTP/2.0 支持得還可以的有 hyper 和 httpx,后者更加簡(jiǎn)單易用一些。

二、反爬蟲

所以,你想到反爬蟲方案了嗎?

如果我們禁用所有的 HTTP/1.x 的請(qǐng)求,是不是能通殺掉一大半爬蟲?requests 沒(méi)法用了,Scrapy 除非升級(jí)到最新版本才能勉強(qiáng)用個(gè)實(shí)驗(yàn)性版本,其他的語(yǔ)言也不用多說(shuō),也會(huì)殺一大部分。

而瀏覽器對(duì) HTTP/2.0 的支持現(xiàn)在已經(jīng)很好了,所以不會(huì)影響用戶瀏覽網(wǎng)頁(yè)的體驗(yàn)。

三、措施

那就讓我們來(lái)吧!

這個(gè)怎么做呢?其實(shí)很簡(jiǎn)單,在 Nginx 里面配置一下就好了,主要就是加這么個(gè)判斷就行了:

if ($server_protocol !~* "HTTP/2.0") {
  return 444;
}

就是這么簡(jiǎn)單,這里 $server_protocol 就是傳輸協(xié)議,其結(jié)果目前有三個(gè):HTTP/1.0、HTTP/1.1 和 HTTP/2.0,另外判斷條件我們使用了 !~* ,意思就是不等于,這里的判斷條件就是,如果不是 HTTP/2.0,那就直接返回 444 狀態(tài)碼,444 一般代表 CONNECTION CLOSED WITHOUT RESPONSE,就是不返回任何結(jié)果關(guān)閉連接。

我的服務(wù)是在 Kubernetes 里面運(yùn)行的,所以要加這個(gè)配置還得改下 Nginx Ingress 的配置,不過(guò)還好 https://kubernetes.github.io/ingress-nginx/user-guide/nginx-configuration/annotations/ 預(yù)留了一個(gè)配置叫做 nginx.ingress.kubernetes.io/server-snippet,利用它我們可以自定義 Nginx 的判定邏輯。

官方用法如下:

apiVersion: networking.k8s.io/v1beta1
kind: Ingress
metadata:
  annotations:
    nginx.ingress.kubernetes.io/server-snippet: |
        set $agentflag 0;
        if ($http_user_agent ~* "(Mobile)" ){
          set $agentflag 1;
        }
        if ( $agentflag = 1 ) {
          return 301 https://m.example.com;
        }

所以這里,我們只需要改成剛才的配置就好了:

apiVersion: networking.k8s.io/v1beta1
kind: Ingress
metadata:
  annotations:
    nginx.ingress.kubernetes.io/server-snippet: |
      if ($server_protocol !~* "HTTP/2.0") {
        return 444;
      }

大功告成!

配置完成了,示例網(wǎng)站是:https://spa16.scrape.center/

我們?cè)跒g覽器中看下效果:

可以看到所有請(qǐng)求都是走的 HTTP/2.0,頁(yè)面完全正常加載。

然而,我們使用 requests 來(lái)請(qǐng)求一下:

import requests
response = requests.get('https://spa16.scrape.center/')
print(response.text)

非常歡樂(lè)的報(bào)錯(cuò):

Traceback (most recent call last):
  ...
    raise RemoteDisconnected("Remote end closed connection without"
http.client.RemoteDisconnected: Remote end closed connection without response
 
During handling of the above exception, another exception occurred:
 
Traceback (most recent call last):
  ...
    raise MaxRetryError(_pool, url, error or ResponseError(cause))
requests.packages.urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='spa16.scrape.center', port=443): Max retries exceeded with url: / (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response')))
 
During handling of the above exception, another exception occurred:
 
Traceback (most recent call last):
 ...
requests.exceptions.ProxyError: HTTPSConnectionPool(host='spa16.scrape.center', port=443): Max retries exceeded with url: / (Caused by ProxyError('Cannot connect to proxy.', RemoteDisconnected('Remote end closed connection without response')))

如果你用 requests,無(wú)論如何都不行的,因?yàn)樗筒恢С?HTTP/2.0。

那我們換一個(gè)支持 HTTP/2.0 的庫(kù)呢?比如 httpx,安裝方法如下:

pip3 install 'httpx[http2]'

注意,Python 版本需要在 3.6 及以上才能用 httpx。

安裝好了之后測(cè)試下:

import httpx
client = httpx.Client(http2=True)
 
response = client.get('https://spa16.scrape.center/')
print(response.text)

結(jié)果如下:

!DOCTYPE html>html lang=en>head>meta charset=utf-8>meta http-equiv=X-UA-Compatible content="IE=edge">meta name=viewport content="width=device-width,initial-scale=1">meta name=referrer content=no-referrer>link rel=icon href=/favicon.ico>title>Scrape | Book/title>link href=/css/chunk-50522e84.e4e1dae6.css rel=prefetch>link href=/css/chunk-f52d396c.4f574d24.css rel=prefetch>link href=/js/chunk-50522e84.6b3e24aa.js rel=prefetch>link href=/js/chunk-f52d396c.f8f41620.js rel=prefetch>link href=/css/app.ea9d802a.css rel=preload as=style>link href=/js/app.b93891e2.js rel=preload as=script>link href=/js/chunk-vendors.a02ff921.js rel=preload as=script>link href=/css/app.ea9d802a.css rel=stylesheet>/head>body>noscript>strong>We're sorry but portal doesn't work properly without JavaScript enabled. Please enable it to continue./strong>/noscript>div id=app>/div>script src=/js/chunk-vendors.a02ff921.js>/script>script src=/js/app.b93891e2.js>/script>/body>/html>

可以看到,HTML 就成功被我們獲取到了!這就是 HTTP/2.0 的魔法!

我們?nèi)绻?nbsp;http2 參數(shù)設(shè)置為 False 呢?

import httpx
client = httpx.Client(http2=False)
 
response = client.get('https://spa16.scrape.center/')
print(response.text)

一樣很不幸:

Traceback (most recent call last):
 ...
    raise RemoteProtocolError(msg)
httpcore.RemoteProtocolError: Server disconnected without sending a response.
 
The above exception was the direct cause of the following exception:
  ...
    raise mapped_exc(message) from exc
httpx.RemoteProtocolError: Server disconnected without sending a response.

所以,這就印證了,只要 HTTP/1.x 通通沒(méi)法治!可以給 requests 燒香了!

又一個(gè)無(wú)敵反爬蟲誕生了!各大站長(zhǎng)們,安排起來(lái)吧~

到此這篇關(guān)于Requests什么的通通爬不了的Python超強(qiáng)反爬蟲方案!的文章就介紹到這了,更多相關(guān)Python反爬蟲內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • 用sleep間隔進(jìn)行python反爬蟲的實(shí)例講解
  • python反爬蟲方法的優(yōu)缺點(diǎn)分析
  • python 常見(jiàn)的反爬蟲策略
  • Python常見(jiàn)反爬蟲機(jī)制解決方案
  • 用python3 urllib破解有道翻譯反爬蟲機(jī)制詳解
  • Python反爬蟲技術(shù)之防止IP地址被封殺的講解
  • Python3爬蟲學(xué)習(xí)之應(yīng)對(duì)網(wǎng)站反爬蟲機(jī)制的方法分析
  • Python中常見(jiàn)的反爬機(jī)制及其破解方法總結(jié)

標(biāo)簽:呂梁 阿里 黑龍江 銅川 株洲 通遼 常德 潛江

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Requests什么的通通爬不了的Python超強(qiáng)反爬蟲方案!》,本文關(guān)鍵詞  Requests,什么,的,通通,爬不,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Requests什么的通通爬不了的Python超強(qiáng)反爬蟲方案!》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于Requests什么的通通爬不了的Python超強(qiáng)反爬蟲方案!的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    久热这里只精品99re8久| 日韩电影免费在线看| 精品伦理精品一区| 欧美日韩午夜剧场| 一级毛片免费看| 中文字幕天堂网| 国内在线高清免费视频| 中文字幕视频在线| 成人全视频高清免费观看| 黄色av资源| 91插插插插插插| 欧美va亚洲va日韩∨a综合色| 国产探花在线精品| 日韩精品在线看| 不卡的国产精品| baoyu135国产精品免费| a国产在线视频| 亚洲三级视频在线观看| 欧美日韩在线观看视频| 神马久久一区二区三区| 国产视频2区| 亚洲一区二区三区加勒比| 美女国产精品久久久| 综合区小说区图片区在线一区| 色婷婷av一区二区三区丝袜美腿| av一区二区三区免费观看| 青青草国产免费| 黄色一级片免费的| 国产成人无码一区二区在线播放| 精品人妻伦一区二区三区久久| 亚洲三级视频网站| 性色av一区二区怡红| 欧美色图国产精品| 国产成人精品视频在线观看| 91网页版在线登录入口| 九九热在线视频观看这里只有精品| 女同一区二区免费aⅴ| 欧美特黄一级大片| 欧美激情亚洲综合一区| 五月天久久综合网| 91精品国产综合久久久蜜臀图片| 亚洲女优在线观看| 久久精品人人做人人爽电影| 第一会所亚洲原创| 一区二区动漫| 国产三级视频在线播放| 国内精品视频| 亚洲美女性生活视频| 91久久精品国产91久久性色| 久久久久久久久久久久久女过产乱| 人妻无码中文字幕免费视频蜜桃| 国产一区二区三区国产| 在线精品视频一区二区| 97在线视频免费播放| 亚洲激情在线观看| 青青操在线观看| 日韩一区自拍| 丝袜亚洲另类欧美| 国产丝袜精品视频| 国产精品福利一区| 在线国产网址| 国产精品高潮久久| 亚洲图片有声小说| 亚洲精品免费在线看| jlzzjlzz国产精品久久| 午夜精品久久99蜜桃的功能介绍| 亚洲三级在线免费| 高清欧美一区二区三区| 久久不见久久见免费视频7| 日韩精品电影网| 国产欧美精品aaaaaa片| 中文字幕乱码一区二区三区| 免费看成年人视频| 成人av影视| 成人免费看黄| 日韩一区二区三区高清在线观看| 国产精品jizz| 欧美性xxxxxx少妇| 丁香六月天婷婷| 欧美久久婷婷综合色| 一区免费在线| 欧美xxxx做受欧美| 亚洲人和日本人hd| 在线一区二区三区精品| 欧美成人精品| 午夜亚洲影视| 日韩久久午夜影院| 亚洲免费影视| 欧美日韩在线中文字幕| 在线观看av网站永久| 亚洲一级免费视频| 欧美精品在线免费观看| 日韩三级毛片| 日韩在线视频观看正片免费网站| 成人写真视频| 亚洲乱码精品一二三四区日韩在线| 欧美成人午夜免费视在线看片| 在线视频观看日韩| jizzjizzjizzjizz日本老师| 中文在线a√在线8| 日本全棵写真视频在线观看| 亚洲 欧美 中文字幕| jizz亚洲女人高潮大叫| 极品销魂一区二区三区| 日韩成人午夜影院| 欧美亚洲另类久久综合| 欧美高清视频在线播放| 成人在线免费播放视频| 国产a久久麻豆| 日韩一级片免费观看| 潘金莲一级淫片aaaaaa播放1| 欧美精品免费播放| 国产精品无码一区| 美女日韩在线中文字幕| 国产欧美一区二区三区在线| 日本动漫理论片在线观看网站| 久久久精品性| 天堂av一区二区三区| 欧美日韩国产高清视频| 欧美在线看片a免费观看| 在线午夜视频| 熟妇女人妻丰满少妇中文字幕| 99久久综合99久久综合网站| 亚洲午夜国产成人av电影男同| xxx在线免费观看| 亚洲精品中文字幕在线| 国产精品高潮粉嫩av| 亚洲人午夜射精精品日韩| 卡通动漫精品一区二区三区| 在线免费三级电影网站| 手机在线视频你懂的| 中文字幕欧美日本乱码一线二线| 三上悠亚av一区二区三区| 久热中文字幕在线精品首页| 亚洲人成伊人成综合网久久久| 亚洲在线视频播放| 欧美/亚洲一区| 中文字幕五月天| 伊人性伊人情综合网| 欧美性一区二区三区| 国产经品一区二区| palipali轻量版永久网页入口| 四虎在线视频免费观看| 美女又爽又黄免费动漫| 成人一区二区三区中文字幕| 天堂网在线.www天堂在线视频| 精品国产av一区二区三区| 成人毛片高清视频观看| 日韩精品免费| 久久中文精品视频| 亚洲欧美日韩不卡一区二区三区| 亚洲欧美日韩综合一区| 中日韩免费毛片| wwwxxxx国产| 在线播放国产一区中文字幕剧情欧美| 欧美日韩不卡视频| 一区二区欧美精品| 欧美一区二区在线免费播放| 91精品国产亚洲| 亚洲精品久久久| 久久青青草综合| 国产精品青青在线观看爽香蕉| 91麻豆免费看片| 99久久国产综合精品女不卡| 日本不卡免费播放| 免费在线观看污网站| 欧美日韩一区成人| 不卡一区二区三区四区| 强制捆绑调教一区二区| 年下总裁被打光屁股sp| 国产主播性色av福利精品一区| 久热国产在线| ts人妖交友网站| 一区二区三区精品视频在线观看| 精品成人在线| 亚洲欧美在线专区| 制服丝袜在线播放| 波多野结衣综合网| 欧美色播在线播放| 成年人视频网站免费| 久久一日本道色综合| 亚洲欧洲视频在线| 日韩av字幕| 人妻精品久久久久中文字幕69| 日本一级片免费看| 在线免费福利| 国产精品久久国产愉拍| 加勒比在线一区| 女女调教被c哭捆绑喷水百合| 精品国产免费一区二区三区香蕉| 一区二区三区波多野结衣在线观看| 四虎免费av| 欧美人与物videos另类xxxxx| 欧美大片免费观看网址| 99re亚洲国产精品| 久久精品国亚洲| 久久久久久成人网| 全色精品综合影院| 特大黑人巨人吊xxxx| 欧美日韩欧美| 国产探花一区在线观看| 国产在线国偷精品免费看| 国产一区一一区高清不卡| 久久无码人妻一区二区三区| 777片理伦片在线观看| 国产欧美久久一区二区| 欧美日韩精品免费观看视频| 国内一区二区三区| 三上悠亚ssⅰn939无码播放| 欧美性色黄在线视频| 97久久亚洲| 成人看片在线| 精品欧美久久久| 成年网站在线看| 欧美精品vⅰdeose4hd| 国产原创在线观看| a中文字幕www| 91精品1区| 91九色在线观看视频| 不卡电影免费在线播放一区| 韩国三级成人在线| 国产真实乱全部视频| 亚洲欧洲精品成人久久奇米网| 国产情侣久久| 午夜福利一区二区三区| 国产黄色av网站| 一区二区三区在线播放欧美| 国内精品美女av在线播放| 7777精品伊久久久大香线蕉语言| 女女百合国产免费网站| 欧美日韩电影在线播放| 日韩福利在线播放| а√天堂在线官网| 亚洲一二三四久久| 久久久久欧美精品| 久久久久国产一区| 日韩一卡二卡三卡国产欧美| 欧美xxxhd| 久久精品99久久无色码中文字幕| 男人的天堂免费在线视频| 日韩欧美在线视频观看| 狠狠综合久久av一区二区| 欧美成人综合网站| 日韩美女视频免费在线观看| 亚洲人成网7777777国产| 粉嫩久久久久久久极品| 日韩和一区二区| 国内精品久久久久影院 日本资源| 久久影视中文字幕| 九色porn蝌蚪| 视频精品一区二区| 中文字幕精品视频在线| 91theporn国产在线观看| 五月综合激情在线| 欧美精品www| 特级毛片在线观看| 久久人妻精品白浆国产| 5566中文字幕一区二区| 中文字幕免费精品一区高清| 天海翼精品一区二区三区| 懂色av一区二区夜夜嗨| 国产又粗又长又硬| 亚洲色图五月天| 欧美性xxxxxxxxx| 欧美一区二区黄片| 岛国视频一区免费观看| 国精产品99永久一区一区| www.日韩大片| 一级在线视频| 99精品在免费线中文字幕网站一区| 中文字幕亚洲二区| 国产一区第一页| 欧美大胆a人体大胆做受| 亚洲a一区二区三区| 手机免费观看av| 不卡在线观看av| 91精品国产一区二区人妖| www.九九热.com| 白白色 亚洲乱淫| 影音先锋另类| 亚洲黄色免费电影| 亚洲熟妇av一区二区三区| 日本中文字幕久久| 亚洲午夜电影网| 91在线观看免费高清| 亚洲同志网站入口| 欧美一级爽aaaaa大片| 成人在线观看91| 日韩一区精品| 国产中文字幕在线看| 久久综合入口| 亚洲永久精品唐人导航网址| 嘿咻视频在线看| 成人在线丰满少妇av| 91国偷自产一区二区使用方法| 国产手机视频一区二区| 亚洲一区二区精品视频| 欧美特级www| www.四虎精品| 最近日韩中文字幕中文| 日韩精品电影网| 久久精品国产一区二区三区不卡| 自拍偷拍国产精品| 中文字幕精品久久久| 91精品国产91久久久久久久久| 精品一区久久久久久| 男人搞女人网站| 欧美亚洲综合色| 国产精品三区在线| 欧美日韩福利视频| 久久精品五月| 国产精品免费看一区二区三区| 中文字幕一区二区在线播放| 亚洲综合福利| 中文字幕在线看精品乱码| 亚洲天堂成人av| 2020中文字字幕在线不卡| 欧美一区二区综合| 成人免费在线观看av| www狠狠操| 久久国产免费视频| 美女av一区| 四虎中文字幕| 国产精品一区二区三区毛片淫片| 久久久美女艺术照精彩视频福利播放| 亚洲女同一区| 亚洲字幕成人中文在线观看| 国产情侣av自拍|