在Python中可以使用XPath來獲取HTML或XML文檔中的li標簽。首先,需要導入相關的庫,例如lxml
庫。
以下是一個使用XPath獲取li標簽的示例代碼:
from lxml import etree
# HTML或XML文檔的示例字符串
html = """
<html>
<body>
<ul>
<li>Item 1</li>
<li>Item 2</li>
<li>Item 3</li>
</ul>
</body>
</html>
"""
# 創建一個XPath解析器
parser = etree.HTMLParser()
# 將字符串解析為一個XPath可解析的對象
tree = etree.fromstring(html, parser)
# 使用XPath表達式獲取li標簽
li_tags = tree.xpath('//li')
# 遍歷獲取到的li標簽
for li in li_tags:
print(li.text)
運行上述代碼會輸出:
Item 1
Item 2
Item 3
在XPath表達式'//li'
中,//
表示選擇文檔中的所有li標簽,而li
表示選擇li標簽。因此,tree.xpath('//li')
會返回一個包含所有li標簽的列表。接下來,可以對這個列表進行遍歷來獲取每個li標簽的內容。