您好,登錄后才能下訂單哦!
小編給大家分享一下如何使用python爬取天氣數據,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
前言
每天一個爬蟲練習,爬個比較簡單的網站
import requests from bs4 import BeautifulSoup import pandas as pd import time def get_data(url): resp = requests.get(url) html = resp.content.decode('gbk') soup = BeautifulSoup(html, 'html.parser') tr_list = soup.find_all('tr') dates, conditions, tempmin, tempmax = [], [], [], [] for data in tr_list[1:]: sub_data = data.text.split() dates.append(sub_data[0]) conditions.append(''.join(sub_data[1:3])) tempmax.append(sub_data[3]) tempmin.append(sub_data[5]) _data = pd.DataFrame() _data["日期"] = dates _data['天氣狀況'] = conditions _data['最高氣溫'] = tempmax _data['最低氣溫'] = tempmin return _data #data_1_month = get_data('此處為任一月份數據的網址') 使用時只需修改此處,具體示例如下 print('正在抓取1月份數據') data_1_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201101.html') print('正在抓取2月份數據') data_2_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201102.html') print('正在抓取3月份數據') data_3_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201103.html') print('正在抓取4月份數據') data_4_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201104.html') print('正在抓取5月份數據') data_5_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201105.html') print('正在抓取6月份數據') data_6_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201106.html') print('正在抓取7月份數據') data_7_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201107.html') print('正在抓取8月份數據') data_8_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201108.html') print('正在抓取9月份數據') data_9_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201109.html') print('正在抓取10月份數據') data_10_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201110.html') print('正在抓取11月份數據') data_11_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201111.html') print('正在抓取12月份數據') data_12_month = get_data('http://www.tianqihoubao.com/lishi/huichang/month/201112.html') print('數據抓取成功!正在整合該年數據,請稍后......') time.sleep(3) data = pd.concat([data_1_month, data_2_month, data_3_month, data_4_month, data_5_month, data_6_month, data_7_month, data_8_month, data_9_month, data_10_month, data_11_month, data_12_month]).reset_index(drop=True) print(data) print('數據整合完畢!') #數據爬取結果會保存在此代碼同一徑下
以上是“如何使用python爬取天氣數據”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。