是的,Python 網頁爬蟲可以抓取 HTTPS 網站。在 Python 中,你可以使用許多庫來抓取 HTTPS 網站,其中最常用的是 Requests 和 urllib 庫。這兩個庫都可以處理 HTTPS 請求,使得爬蟲能夠訪問和抓取 HTTPS 網站的內容。
例如,使用 Requests 庫抓取 HTTPS 網站的簡單示例代碼如下:
import requests
url = 'https://www.example.com'
response = requests.get(url)
if response.status_code == 200:
print(response.text)
else:
print('Error:', response.status_code)
這段代碼首先導入 Requests 庫,然后定義要抓取的 HTTPS 網站 URL。接著,使用 requests.get()
函數發起 GET 請求,并將返回的響應對象存儲在變量 response
中。最后,檢查響應的狀態碼是否為 200(表示請求成功),如果是,則打印響應的文本內容;否則,打印錯誤狀態碼。