您好,登錄后才能下訂單哦!
首先,安裝Beautifulsoup
pip install beautifulsoup4
然后初始化對象
from bs4 import BeautifulSoup
file = BeautifulSoup(open("index.html")) #此處傳入文件,紅色部分為要傳入的頁面源碼文件
string = BeautifulSoup("<html>data</html>") #此處紅色部分傳入一個字符串
可以通過 .標簽名 向下深入, 如 : file.p.a.span
遍歷:
html 文件有標簽,字符串等組成,遍歷時可以同級遍歷,也可以跨級遍歷。
同級遍歷: .previous_sibling
.next_sibling
跨級遍歷:
向父級遍歷:
.parent
向子級遍歷:
.contents #以列表形式遍歷,通過一個列表將結果展示出來
.children #以生成器形式遍歷,比較節省內存
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。