亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python網絡爬蟲 -- scrapy的選擇器Xpath

發布時間:2020-07-06 09:11:02 來源:網絡 閱讀:329 作者:Python熱愛者 欄目:編程語言

Xpath簡介

一般來說,使用id、name、class等屬性就能對節點進行定位就能解決絕大部分解析需求,但有時候遇到以下情況,使用Xpath就更方便:

沒有id、name、class等

標簽的屬性或者文本特征不顯著

標簽嵌套層次太復雜

Xpath是XMLPath的簡介,基于XML樹狀結構,可以在整個樹中尋找鎖定目標節點。由于HTML文檔本身就是一個標準的XML頁面,因此我們可以使用XPath的語法來定位頁面元素。

Xpath定位方法

一、Xpath路徑

Python網絡爬蟲 -- scrapy的選擇器Xpath

Xpath路徑案例

定位節點


Python網絡爬蟲 -- scrapy的選擇器Xpath

通配符*選擇未知的節點


Python網絡爬蟲 -- scrapy的選擇器Xpath

二、使用索引

如果篩選時元素時出現多個節點,但我們想確定唯一節點。可以使用類似于列表索引的方式精確定位。

案例


Python網絡爬蟲 -- scrapy的選擇器Xpath

三、使用屬性

為了讓定位更精準,跟使用索引類似,我們要增加信息量,那么還可以使用屬性。@符號是屬性符


Python網絡爬蟲 -- scrapy的選擇器Xpath

四、常用函數

除了索引、屬性外,Xpath還可以使用便捷的函數來增強定位的準確性。下面試常用的幾個函數:

Python網絡爬蟲 -- scrapy的選擇器Xpath

<a class="menu_hot" href="/ads/auth/promote.html">應用推廣</a>


Python網絡爬蟲 -- scrapy的選擇器Xpath

五、Xpath軸

這部分類似BeautifulSoup中的sibling、parents、children方法。

Python網絡爬蟲 -- scrapy的選擇器Xpath


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

常熟市| 保德县| 绿春县| 共和县| 阿巴嘎旗| 辽源市| 高雄县| 云林县| 丽江市| 商城县| 淮北市| 大港区| 荣昌县| 大化| 宿州市| 榆树市| 封开县| 元朗区| 永修县| 德昌县| 平山县| 鄂伦春自治旗| 合山市| 黔江区| 安龙县| 西吉县| 井陉县| 吉木萨尔县| 鹤岗市| 秦皇岛市| 定州市| 车致| 密山市| 锡林浩特市| 阳曲县| 南溪县| 建德市| 吉木乃县| 电白县| 焉耆| 乌兰察布市|