您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關python中怎么獲取標題和鏈接,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
先上代碼
from requests_html import HTMLSession session = HTMLSession() url = "https://my.oschina.net/u/4798232"r = session.get(url)for i in range(1, 12): i = str(i) urlxpath = '//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a' bt = r.html.xpath(urlxpath, first=True).text c = urlxpath+'/@href' link = r.html.xpath(c, first=True) a = "原" if bt.find(a) == -1:print(bt)print(link)else:print(bt.replace(a, ""))print(link)
首先呢,這個是通過xpath來進行操作的,具體如何復制xpath可以看我的https://zjzdmc.top/jsfx/47.html這篇文章,里面有動圖。
然后導入什么庫啥的,都是老生常談的了,在a標簽中,你復制的xpath為//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a這個,然后呢,我們獲取標題的話,加上.text這個屬性,就會變成文字了,而其中的文字我們可以看f12內的內容,發現其實只有標題,而我們如果需要連接的話,只需要加上這個/@href即可獲取鏈接了。不過目前其實沒有找到更好的獲取所有文字序列的方法,所以我們直接看最前面的文章id和最后一篇文章的id,記錄下來即可。之后我們只需要遍歷一下1-12的值即可,然后給字符串添加變量的方法為字符串+變量+字符串即可'//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'如文字所示,即可獲取所有文章的標題了,然后給之前定義的變量urlxpath后面添加上/@href后,即可獲取改xpath內的鏈接了,之后輸出即可了。
以上就是python中怎么獲取標題和鏈接,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。