Python爬蟲XPath怎么用

發布時間：2021-11-18 13:00:10 來源：億速云閱讀：152 作者：小新欄目：開發技術

這篇文章主要為大家展示了“Python爬蟲XPath怎么用”，內容簡而易懂，條理清晰，希望能夠幫助大家解決疑惑，下面讓小編帶領大家一起研究并學習一下“Python爬蟲XPath怎么用”這篇文章吧。

一、問題描述

1.什么是XPath？

xpath是一門在XML和HTML文檔中查找信息的語言，可用來在XML和HTML文檔中對元素和屬性進行遍歷，XPath 通過使用路徑表達式來選取 XML 文檔中的節點或者節點集。這些路徑表達式和在常規的電腦文件系統中看到的表達式非常相似。

二、解決方案

1.XPath語法

想要學好xpath，首先要搞明白html文檔中的節點。

<div>
     <ul>
          <li class="item-0"><a href="link1.html" rel="external nofollow" >first item</a></li>
          <li class="item-1"><a href="link2.html" rel="external nofollow" >second item</a></li>
          <li class="item-inactive"><a href="link3.html" rel="external nofollow" >third item</a></li>
          <li class="item-1"><a href="link4.html" rel="external nofollow" >fourth item</a></li>
          <li class="item-0"><a href="link5.html" rel="external nofollow" >fifth item</a> # 注意，此處缺少一個 </li> 閉合標簽
      </ul>
  </div>

以上是在網上隨便找的一段html的文本，可以觀察得到，div的標簽下是ul標簽，而ul標簽下是li標簽，于是發現html的標簽是一級一級如樹狀的。Xpath正是通過這樣的方式去尋找。以生活中舉例，要確定一個人的位置，首先確定他在中國，然后確定他在某個省份，哪座城市，那個小區，最后找到他。

表達式	描述
Nodename	選取此節點的所有子節點 bookstore 選取bookstore下所有的子節點
/	如果是在最前面，代表從根節點選取。否則選擇某節點下的某個節點 /bookstore 選取根元素下所有的bookstore節點
//	從全局節點中選擇節點，隨便在哪個位置 //book 從全局節點中找到所有的book節點
@	選取某個節點的屬性 //book[@price] 選擇所有擁有price屬性的book節點
.	當前節點
Text()	獲取標簽中的文本

同級標簽可以用li[1] ,li[2] ,li[3]的方式獲取

2.lxml庫

簡單介紹一下lxml庫，接下來會用到它

lxml是一個HTML/XML的解析器，主要的功能是如何解析和提取HTML/XML 數據。

lxml和正則一樣，也是用C實現的，是一款高性能的PythonHTML/XML解析器，可以利用之前學習的XPath語法，來快速的定位特定元素以及節點信息。

3.實際案例

隨便爬取一個網站，找到找到網站的html文本

如下圖：

Python爬蟲XPath怎么用

要找到title和href，仔細觀察可以得到路徑分別是//div[@id="resultList"]/div[@class="el"]/p/span/a/@title

//div[@id="resultList"]/div[@class="el"]/p/span/a/@href

運行如下：

Python爬蟲XPath怎么用

以上是“Python爬蟲XPath怎么用”這篇文章的所有內容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內容對大家有所幫助，如果還想學習更多知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

Python爬蟲XPath怎么用

一、問題描述

1.什么是XPath？

二、解決方案

1.XPath語法

2.lxml庫

3.實際案例

猜你喜歡

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

Python爬蟲XPath怎么用

一、問題描述

1.什么是XPath？

二、解決方案

1.XPath語法

2.lxml庫

3.實際案例

猜你喜歡

最新資訊

相關推薦

相關標簽