您好,登錄后才能下訂單哦!
小編給大家分享一下解決python3中request亂碼的問題,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
requests解析中文頁面出現亂碼的解決方法
第一部分 關于requests庫
requests是一個很實用的Python HTTP客戶端庫,編寫爬蟲和測試服務器響應數據時經常會用到。
其中的Request對象在訪問服務器后會返回一個Response對象,這個對象將返回的Http響應字節碼保存到content屬性中。
但是如果你訪問另一個屬性text時,會返回一個unicode對象,亂碼問題就會常常發成在這里。
因為Response對象會通過另一個屬性encoding來將字節碼編碼成unicode,而這個encoding屬性居然是responses自己猜出來的。
第二部分 解決方法
所以要么你直接使用content(字節碼),要么記得把encoding設置正確,比如我獲取了一段gbk編碼的網頁,就需要以下方法才能得到正確的unicode。
import requests url = "http://xxx.xxx.xxx" response = requests.get(url) response.encoding = 'gbk' print(response.text)
看完了這篇文章,相信你對解決python3中request亂碼的問題有了一定的了解,想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。