亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python3簡單爬蟲抓取網頁圖片代碼實例

發布時間:2020-08-22 00:00:31 來源:腳本之家 閱讀:190 作者:瀛洲過客 欄目:開發技術

現在網上有很多python2寫的爬蟲抓取網頁圖片的實例,但不適用新手(新手都使用python3環境,不兼容python2),

所以我用Python3的語法寫了一個簡單抓取網頁圖片的實例,希望能夠幫助到大家,并希望大家批評指正。

import urllib.request
import re
import os
import urllib
#根據給定的網址來獲取網頁詳細信息,得到的html就是網頁的源代碼 
def getHtml(url):
  page = urllib.request.urlopen(url)
  html = page.read()
  return html.decode('UTF-8')

def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = imgre.findall(html)#表示在整個網頁中過濾出所有圖片的地址,放在imglist中
  x = 0
  path = 'D:\\test' 
  # 將圖片保存到D:\\test文件夾中,如果沒有test文件夾則創建
  if not os.path.isdir(path): 
    os.makedirs(path) 
  paths = path+'\\'   #保存在test路徑下 

  for imgurl in imglist: 
    urllib.request.urlretrieve(imgurl,'{0}{1}.jpg'.format(paths,x)) #打開imglist中保存的圖片網址,并下載圖片保存在本地,format格式化字符串 
    x = x + 1 
  return imglist
html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網址網頁詳細信息,得到的html就是網頁的源代碼 
print (getImg(html)) #從網頁源代碼中分析并下載保存圖片

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

托克托县| 衡阳市| 东山县| 西乌| 萨嘎县| 延安市| 彭山县| 华容县| 荣昌县| 乐亭县| 克拉玛依市| 仲巴县| 信阳市| 包头市| 宜章县| 仁怀市| 天津市| 兰西县| 凤凰县| 康马县| 福贡县| 台北县| 运城市| 杭锦旗| 临江市| 高淳县| 洞头县| 休宁县| 台州市| 宁波市| 滦南县| 镇远县| 永顺县| 怀远县| 满洲里市| 尼玛县| 平阴县| 永新县| 陈巴尔虎旗| 花莲县| 舞阳县|