亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python中怎么獲取標題和鏈接

發布時間:2021-07-28 17:48:19 來源:億速云 閱讀:297 作者:Leah 欄目:大數據

本篇文章給大家分享的是有關python中怎么獲取標題和鏈接,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

先上代碼

from requests_html import HTMLSession
session = HTMLSession()
url = "https://my.oschina.net/u/4798232"r = session.get(url)for i in range(1, 12):
    i = str(i)
    urlxpath = '//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'    bt = r.html.xpath(urlxpath, first=True).text
    c = urlxpath+'/@href'    link = r.html.xpath(c, first=True)
    a = "原"    if bt.find(a) == -1:print(bt)print(link)else:print(bt.replace(a, ""))print(link)

首先呢,這個是通過xpath來進行操作的,具體如何復制xpath可以看我的https://zjzdmc.top/jsfx/47.html這篇文章,里面有動圖。

然后導入什么庫啥的,都是老生常談的了,在a標簽中,你復制的xpath為//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a這個,然后呢,我們獲取標題的話,加上.text這個屬性,就會變成文字了,而其中的文字我們可以看f12內的內容,發現其實只有標題,而我們如果需要連接的話,只需要加上這個/@href即可獲取鏈接了。不過目前其實沒有找到更好的獲取所有文字序列的方法,所以我們直接看最前面的文章id和最后一篇文章的id,記錄下來即可。之后我們只需要遍歷一下1-12的值即可,然后給字符串添加變量的方法為字符串+變量+字符串即可'//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'如文字所示,即可獲取所有文章的標題了,然后給之前定義的變量urlxpath后面添加上/@href后,即可獲取改xpath內的鏈接了,之后輸出即可了。

以上就是python中怎么獲取標題和鏈接,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

浦城县| 内丘县| 河东区| 柏乡县| 曲沃县| 安西县| 宣威市| 商丘市| 阿克陶县| 洛扎县| 额济纳旗| 罗平县| 白河县| 滁州市| 东莞市| 望都县| 额济纳旗| 利津县| 从江县| 安龙县| 旬阳县| 广西| 察哈| 孝义市| 宝坻区| 石嘴山市| 治多县| 广元市| 马鞍山市| 繁峙县| 乌审旗| 灌阳县| 龙井市| 固镇县| 永昌县| 武汉市| 渭源县| 乐平市| 合作市| 辽阳市| 仙居县|