您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關wordpress的采集方法,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
WordPress是一種使用PHP語言開發的建站程序平臺,現在做博客用wp的已經很多了,很多網站制作培訓都使用的是wp,特別是在做采集站的時候wordpress的共能很強大。下面就給大家介紹如何實現wp的自動采集功能。
1、安裝網站采集插件:WP-AutoPost
2、點擊“新建任務”后,輸入任務名稱,即可創建新任務,創建好新任務之后可以在任務列表中查看到該任務,就可對該任務進行更多設置。(這一部分不需要修改設置,唯一需要改動的就是采集的時間。)
3、文章來源設置。在該選項卡下我們需要設置文章來源的 文章列表網址 及 具體文章的匹配規則。我們以采集”新浪互聯網新聞“為例,文章列表網址為http://roll.tech.sina.com.cn/internet_worldlist/index.shtml,因此在 手工指定文章列表網址 中輸入該網址即可,如下所示:
4、文章網址匹配規則。文章網址匹配規則的設置非常簡單,無需復雜設置,提供兩種匹配模式,可以使用URL通配符匹配,也可以使用CSS選擇器進行匹配,通常使用URL通配符匹配較為簡單,但有時使用CSS選擇器更為精確。
5、 使用URL通配符匹配。通過點擊列表網址 http://roll.tech.sina.com.cn/internet_worldlist/index.shtml 上的文章,我們可以發現每篇文章的URL都為如下結構:http://tech.sina.com.cn/i/2013-06-27/16328485884.shtml,因此將URL中變化的數字或字母替換為通配符 (*) 即可,如:http://tech.sina.com.cn/i/(*)/(*).shtml 。重復的網址可以使用301重定向。
6、使用CSS選擇器進行匹配。使用CSS選擇器進行匹配,我們只需要設置文章網址的CSS選擇器即可,通過查看列表網址http://roll.tech.sina.com.cn/internet_worldlist/index.shtml的源代碼即可輕松設置,找到列表網址下文章超鏈接的代碼,如下所示:
7、可以看到,文章的超鏈接A標簽在class為“contList”的標簽內部,因此文章網址的CSS選擇器只需要設置為 .contList a 即可,如下所示:
8、設置完成之后,不知道設置是否正確,可以點擊上圖中的測試按鈕,如果設置正確,將列出該列表網址下所有文章名稱和對應的網頁地址,如下所示:
9、其他的設置可以不用修改。
10、以上采集方法適用于WordPress多站點功能。
關于wordpress的采集方法就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。