亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

使用爬蟲遇到的一些問題

發布時間:2020-06-28 21:26:24 來源:網絡 閱讀:448 作者:吳流 欄目:編程語言

本博客會記錄博主在使用爬蟲過程中遇到的問題,不斷更新,希望以后再遇到這些問題的時候,可以快速解決。

1、在爬取和訊博客的時候發現閱讀數和評論數無法正常讀取。通過抓包工具抓取到了閱讀數和評論數的URL,但是復制到瀏覽器上打開發現一片空白。在抓包工具Raw里發現,有一項Refere,后面將此項加到headers信息里,數據可以正常顯示出來了。代碼如下:

import urllib.request

url='http://click.tool.hexun.com/click.aspx?articleid=116367158&blogid=19050645'

data={

"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36",
"Referer":"http://27783968.blog.hexun.com/116367158_d.html",

}

request=urllib.request.Request(url,headers = data)
data=urllib.request.urlopen(request).read().decode("utf-8","ignore")
print(data)

此次難點在于不熟悉urllib庫是如何添加更多的請求信息到heagers里,在以上代碼中,data里還可以添加更加多的請求,比如cookie等信息,記錄此次代碼的目的在于熟悉urllib.request.Reques的用法

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

兰州市| 信阳市| 竹北市| 镇坪县| 西乌珠穆沁旗| 黔西县| 绥棱县| 蒙城县| 江西省| 古田县| 鸡西市| 平遥县| 图木舒克市| 苗栗市| 武隆县| 沭阳县| 四平市| 皋兰县| 益阳市| 彰化市| 台中县| 东辽县| 江孜县| 冀州市| 遵义市| 毕节市| 厦门市| 丰都县| 屏东县| 西峡县| 呼玛县| 连城县| 公主岭市| 和龙市| 兴安盟| 锡林郭勒盟| 靖江市| 建宁县| 民丰县| 永福县| 长治市|