亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python爬蟲學習之獲取指定網頁源碼

發布時間:2020-10-17 08:48:18 來源:腳本之家 閱讀:234 作者:羅思洋 欄目:開發技術

本文實例為大家分享了Python獲取指定網頁源碼的具體代碼,供大家參考,具體內容如下

1、任務簡介

前段時間一直在學習Python基礎知識,故未更新博客,近段時間學習了一些關于爬蟲的知識,我會分為多篇博客對所學知識進行更新,今天分享的是獲取指定網頁源碼的方法,只有將網頁源碼抓取下來才能從中提取我們需要的數據。

2、任務代碼

Python獲取指定網頁源碼的方法較為簡單,我在Java中使用了38行代碼才獲取了網頁源碼(大概是學藝不精),而Python中只用了6行就達到了效果。

Python中獲取網頁源碼最簡單的方法就是使用urllib包,具體代碼如下:

import urllib.request    #導入urllib.request庫
b = str(input("請輸入:"))  #提示用戶輸入信息,并強制類型轉換為字符串型
a = urllib.request.urlopen(b)#打開指定網址
html = a.read()       #讀取網頁源碼
html = html.decode("utf-8") #解碼為unicode碼
print(html)         #打印網頁源碼

我輸入的網址是我博客主頁的網址https://blog.csdn.net/lsylsy726

運行結果如下:

Python爬蟲學習之獲取指定網頁源碼

3、總結

這篇博客介紹的方法較為簡單,其實有的網站會“反爬蟲”,這時就需要我們使用User-Agent或者代理,這些東西都會在后面的博客中進行更新,我預計在后面博客中更新“讀取CSDN博客訪問量的小程序”和“有道翻譯小程序”及其他更難一些的知識,由于剛開始學習爬蟲,水平有限,請大家多多包涵。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

普兰县| 台安县| 汽车| 衡阳市| 乡城县| 黄龙县| 靖边县| 镇原县| 汉阴县| 眉山市| 汤原县| 南开区| 崇左市| 东海县| 洛南县| 拜泉县| 米林县| 阳城县| 内乡县| 元阳县| 南宫市| 泰顺县| 凯里市| 阜康市| 侯马市| 蛟河市| 周口市| 阳江市| 永州市| 响水县| 繁昌县| 平山县| 河曲县| 工布江达县| 达孜县| 都昌县| 法库县| 青河县| 三台县| 南康市| 乌鲁木齐县|