您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關如何進行PyQuery理論分析,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
hello,各位小伙伴,大家好,上次我們是了解到了html的基礎知識,那有人就有疑問了,我是查看到了html上的信息了,我想獲取了,但是如何才能把其上面的我想要的信息給拿下來呢?有什么工具嗎?嗯,說明這位同學還是很愛思考的,目前我們市面上可以獲取html的相關工具是非常多的,目前工業界用的比較多的是:BeautifulSoup、xpath、 pyquery。今天我們介紹的是pyquery 這個也是我在工作中用的最多的一款工具,可以說是非常的得心應手。好,接下來我們就來了解一下這個工具。
pyquery庫是jQuery的Python實現,可以用于解析HTML網頁內容,官方文檔地址是:http://packages.python.org/pyquery/
pyquery 可讓你用 jQuery 的語法來對 xml 進行操作。這I和 jQuery 十分類似。如果利用 lxml,pyquery 對 xml 和 html 的處理將更快。
這個庫不是(至少還不是)一個可以和 JavaScript交互的代碼庫,它只是非常像 jQuery API 而已。
pip install pyquery
或下載安裝:https://pypi.python.org/pypi/pyquery/#downloads
引入庫:from pyquery import PyQuery as pq
1、直接字符串
doc=pq("<html></html>") pq 參數可以直接傳入 HTML 代碼,doc 現在就相當于 jQuery 里面的 $ 符號了
2、lxml.etree
doc=pq(etree.fromstring("<html></html>"))
可以首先用 lxml 的 etree 處理一下代碼,這樣如果你的 HTML 代碼出現一些不完整或者疏漏,都會自動轉化為完整清晰結構的 HTML代碼。
3、直接傳URL
doc=pq('http://www.baidu.com')
這里就像直接請求了一個網頁一樣,類似用 urllib2 來直接請求這個鏈接,得到 HTML 代碼
4、傳文件
doc=pq(filename='hello.html')
可以直接傳某個路徑的文件名。
上述就是小編為大家分享的如何進行PyQuery理論分析了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。