您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關用Python自動獲取目標網站最新通知的方法,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
Python之自動獲取目標網站最新通知:
1、建立通知數據庫
這一步的目的是爬取目標網站已經發布的通知的數據,并進行存儲,從而建立與該目標網站內容相對應的本地數據庫。
考慮到數據庫中的數據將是辨別和獲取一則新通知的唯一方法,因此所建立的數據庫將存儲每一條通知的標題、發布日期和訪問鏈接。
第一步使用到的模塊有urllib、BeautifulSoup和sqlite3模塊。其中,通過urllib模塊爬取目標網頁html數據;通過BeautifulSoup模塊解析網頁數據、爬取網頁內容;通過sqlite3模塊建立目標網站已有通知數據庫。
該步主要代碼展示如下。
2、建立郵件發送系統
這一步的目的是使用Python標準庫模塊smtplib來訪問網絡,創建一個發送電子郵件的功能。
由于我們大部分人的計算機并沒有建立自己的郵件服務器,因此需借助第三方服務器來模擬郵件發送。
常用的有谷歌郵件系統、網易郵件系統和QQ郵件系統,如QQ郵件系統的SMTP服務器和端口號分別為smtp.qq.com和465。
該步主要代碼展示如下。
在這個示例中,使用了Python標準庫中的email模塊將電子郵件信息進行了格式化,主要包括郵件的主題與發件人、收件人郵箱昵稱和郵件內容等信息。
3、解析檢測目標網站通知
前面兩步,已經完成了目標網站已有通知數據庫和郵件發送系統的建立,第三步要完成的工作,主要由兩部分組成。
一是,利用第一步使用的urllib、BeautifulSoup模塊解析目標網站內容數據,并與前面建立的數據庫進行對比檢測。
二是,若檢測到目標網站有新的通知,則將新通知數據插入到數據庫中,然后,發送提示電子郵件。
該步主要代碼展示如下。
在這個示例中,只選取了最新的一條通知發送了電子郵件提示,具體郵件信息可自己設定。
4、制定計劃任務
前面三步,已經完成了使用Python獲取目標網站最新通知,并發送提示電子郵件的腳本程序。
在這一步,將使用Windows自帶的DOS命令框架和任務計劃程序去每小時自動運行一次Python腳本,實現自動更新通知的目的。
首先,需要編寫一個cmd命令文件,方便在DOS框架下執行Python腳本。
主要代碼展示如下:
@echo off # 關閉回顯 cd C:\demo # 找到Python腳本文件的路徑 python Python.py # 執行Python腳本文件
最后,使用任務計劃程序制定一個任務,可設定為每隔一小時自動運行一次cmd命令文件。
關于用Python自動獲取目標網站最新通知的方法就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。