亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python數據爬蟲有什么用

發布時間:2020-11-12 09:50:00 來源:億速云 閱讀:146 作者:小新 欄目:編程語言

這篇文章主要介紹python數據爬蟲有什么用,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

一、爬蟲工作原理

獲取網頁——分析網頁源代碼——提取信息,便是爬蟲工作的三部曲。

二、爬蟲的基本流程:

用戶獲取網絡數據的方式:

方式1:瀏覽器提交請求--->下載網頁代碼--->解析成頁面。

方式2:模擬瀏覽器發送請求(獲取網頁代碼)->提取有用的數據->存放于數據庫或文件中。

包括以下內容:

1、發起請求

2、獲取響應內容

3、解析內容

4、保存數據

應用場景

1、互聯網平臺,偏向銷售公司,客戶信息的爬取

2、資訊爬取并應用到平臺業務中

3、競品公司重要數據挖掘分析與應用

實戰例子

項目原理:打開網址-獲取源碼-找到圖片-匹配下載

 
#coding=utf-8
 
'''
 
Created on 2017年1月28日
 
@author: gaojs
 
'''
 
import urllib,re,os
 
def getHtml():
 
page=urllib.urlopen('').read()#打開網址并且讀取
 
return page
 
x=0
 
def getimg(page):
 
imgre=re.compile(r' src="(.*?)" class=')
 
imglist=re.findall(imgre,page)
 
for imgurl in imglist:
 
# print imgurl
 
global x
 
if not os.path.exists('/Users/gaojs/Desktop/pic'):
 
print os.mkdir('/Users/gaojs/Desktop/pic/')
 
else:
 
urllib.urlretrieve(imgurl,'/Users/gaojs/Desktop/pic/'+'%s.jpg'%x)#下載圖片到指定位置
 
x+=1
 
print u'正在下載第%s張'%x
 
l=getHtml()
 
getimg(l)

以上是python數據爬蟲有什么用的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

渝北区| 道孚县| 巴中市| 喀喇沁旗| 抚州市| 成安县| 永善县| 建宁县| 平罗县| 如东县| 来宾市| 突泉县| 古丈县| 阜新| 冀州市| 呼和浩特市| 永寿县| 安国市| 康平县| 稷山县| 兴国县| 砀山县| 潜江市| 江陵县| 上高县| 泗洪县| 朝阳区| 玛多县| 筠连县| 仙游县| 秦皇岛市| 盐津县| 响水县| 凤山市| 巢湖市| 太保市| 淅川县| 平谷区| 治县。| 沙田区| 蚌埠市|