Python3簡單爬蟲抓取網頁圖片代碼實例

發布時間：2020-08-22 00:00:31 來源：腳本之家閱讀：190 作者：瀛洲過客欄目：開發技術

現在網上有很多python2寫的爬蟲抓取網頁圖片的實例，但不適用新手（新手都使用python3環境，不兼容python2），

所以我用Python3的語法寫了一個簡單抓取網頁圖片的實例，希望能夠幫助到大家，并希望大家批評指正。

import urllib.request
import re
import os
import urllib
#根據給定的網址來獲取網頁詳細信息，得到的html就是網頁的源代碼 
def getHtml(url):
  page = urllib.request.urlopen(url)
  html = page.read()
  return html.decode('UTF-8')

def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = imgre.findall(html)#表示在整個網頁中過濾出所有圖片的地址，放在imglist中
  x = 0
  path = 'D:\\test' 
  # 將圖片保存到D:\\test文件夾中，如果沒有test文件夾則創建
  if not os.path.isdir(path): 
    os.makedirs(path) 
  paths = path+'\\'   #保存在test路徑下 

  for imgurl in imglist: 
    urllib.request.urlretrieve(imgurl,'{0}{1}.jpg'.format(paths,x)) #打開imglist中保存的圖片網址，并下載圖片保存在本地，format格式化字符串 
    x = x + 1 
  return imglist
html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網址網頁詳細信息，得到的html就是網頁的源代碼 
print (getImg(html)) #從網頁源代碼中分析并下載保存圖片

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持億速云。

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

Python3簡單爬蟲抓取網頁圖片代碼實例

猜你喜歡

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

Python3簡單爬蟲抓取網頁圖片代碼實例

猜你喜歡

最新資訊

相關推薦

相關標簽