亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中bs4基礎的示例分析

發布時間:2021-08-25 14:36:50 來源:億速云 閱讀:139 作者:小新 欄目:開發技術

這篇文章給大家分享的是有關Python中bs4基礎的示例分析的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

安裝

在命令提示符框中直接輸入pip install beautifulsoup4

介紹

beautifulsoup是python的一個第三方庫,和xpath一樣,都是用來解析html數據的。

引入

from bs4 import BeautifulSoup

使用

將一段文檔傳入BeautifulSoup的構造方法,就能得到一個文檔的對象。

bs = BeautifulSoup(open('index.html',encoding='utf-8'),'lxml')
print(bs)

注意:這樣上傳文檔的話,BeautifulSoup里面需要兩個參數。一個為open方法,一個是固定寫法,也就是解析器。

open方法里面也同樣需要兩個參數,一個是想要解析的數據,另一個為設置編碼的格式。

(1)獲取網頁中的title標簽

print(bs.title)

(2)獲取head標簽及標簽內部的所有其他標簽

print(bs.head)

(3)獲取當中的第一個a標簽

print(bs.a)

注意:獲取文檔當中所有的xx當中第一個xx或者第一個xx里面的內容。都可以用bs.xx來獲取

(4)獲取指定標簽的所有屬性

print(bs.a.attrs)

(5)獲取標簽的屬性

print(bs.a['href'])

(6)獲取標簽的文本內容。

print(bs.a.string)

注意:string獲取的文本指的是本標簽的文本,不包含子標簽的文本

(7)contents能夠獲取指定標簽下面的所有內容。

print(bs.body.contents)

(8)獲取所有內容當中指定索引的內容

print(bs.div.contents[3])

(9)通過id和類名來找標簽

print(bs.find(id='kw'))
print(bs.find(class_='shopping'))

注意:id是唯一的,通過id來找,只能找到一個,所以用find,而class不是唯一的,通過class來找,就有可能找到多個。

(10)select選擇指定的標簽

print(bs.select('title'))
print(bs.select('a'))

在bs4中,小數點“.”表示類名,#表示id

print(bs.select('.first'))
print(bs.select('#kw'))
print(bs.select('div.now'))

感謝各位的閱讀!關于“Python中bs4基礎的示例分析”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

咸丰县| 郁南县| 新巴尔虎左旗| 伊春市| 武邑县| 西贡区| 丹寨县| 奉化市| 门源| 武威市| 衡山县| 山阴县| 永昌县| 禹州市| 和静县| 新巴尔虎右旗| 鞍山市| 罗甸县| 达州市| 北宁市| 凤城市| 安徽省| 永丰县| 古蔺县| 长垣县| 六安市| 克什克腾旗| 怀宁县| 江源县| 卓尼县| 玉林市| 延寿县| 定结县| 望江县| 陕西省| 桐庐县| 澄迈县| 翼城县| 古丈县| 文山县| 大同县|