亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python分布式爬蟲中使用消息隊列的示例

發布時間:2020-12-01 09:40:14 來源:億速云 閱讀:284 作者:小新 欄目:編程語言

這篇文章給大家分享的是有關python分布式爬蟲中使用消息隊列的示例的內容。小編覺得挺實用的,因此分享給大家做個參考。一起跟隨小編過來看看吧。

實現分布式爬取的關鍵是消息隊列,這個問題以消費端為視角更容易理解。你的爬蟲程序部署到很多臺機器上,那么他們怎么知道自己要爬什么呢?總要有一個地方存儲了他們需要爬取的url吧,這樣他們才能工作。

假設有1萬個url需要爬取,而你有100個爬蟲程序部署在10臺機器上,每臺10個爬蟲程序在運行,一個url被分給爬蟲程序后,其他爬蟲不能再獲得這個url,不然,就重復爬取了,理解吧,分布式爬蟲的關鍵是怎么把任務分給這些爬蟲。

有些促銷活動的現場會進行抽獎活動,工作人員捧著一個透明的箱子,參與活動的人從箱子的小口處把手伸進去隨機拿出一張折疊的紙條,這種模式與消息隊列十分相似。消息隊列就好比這個抽獎的箱子,消費端的爬蟲程序就好比參與活動的顧客,爬蟲從消息隊列里拿出一個url任務,然后進行爬取,不同于抽獎活動時一個人只能拿一次,分布式爬蟲允許爬蟲在結束一個爬蟲任務后繼續從消息隊列里獲取任務。

使用redis的隊列做消息隊列

如果你只是簡單的寫一個分布式爬蟲,那么使用redis的隊列就可以了,它完全可以作為消息隊列來使用,下面的代碼是生產端的代碼示例

import redis
 
 
r = redis.Redis(host='127.0.0.1', port=6379,
                password='yourpassword', db=1)
 
 
# 生產10個url任務
for i in range(10):
    r.lpush('url_queue', i)

感謝各位的閱讀!關于python分布式爬蟲中使用消息隊列的示例就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

双牌县| 华容县| 平乡县| 新乡市| 吉水县| 浮梁县| 海门市| 普兰店市| 苏尼特右旗| 岑巩县| 榆社县| 宜都市| 台安县| 汝州市| 会泽县| 邯郸县| 嵊泗县| 邵阳县| 罗江县| 庆城县| 黔西| 阜城县| 四平市| 绩溪县| 沂水县| 穆棱市| 海城市| 前郭尔| 贞丰县| 简阳市| 九江市| 林口县| 丰原市| 叙永县| 东光县| 乐都县| 徐闻县| 保德县| 新兴县| 兰西县| 陆川县|