亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python打印網頁亂碼的解決方法

發布時間:2020-09-01 10:00:20 來源:億速云 閱讀:440 作者:小新 欄目:編程語言

這篇文章將為大家詳細講解有關python打印網頁亂碼的解決方法,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

Python是個好工具,但是也有其固有的一些缺點。最近在學習網頁爬蟲時就遇到了這樣一種問題,中文網站爬取下來的內容往往中文顯示亂碼。看過我之前博客的同學可能知道,之前爬取的一個學校網頁就出現了這個問題,但是當時并沒有解決,這著實成了我一個心病。這不,剛剛一解決就將這個方法公布與眾,大家一同分享。

首先,我說一下Python中文亂碼的原因,Python中文亂碼是由于Python在解析網頁時默認用Unicode去解析,而大多數網站是utf-8格式的,并且解析出來之后,python竟然再以Unicode字符格式輸出,會與系統編碼格式不同,導致中文輸出亂碼,知道原因后我們就好解決了。下面上代碼,實驗對象仍是被人上了無數遍的百度主頁~

# -*- coding: utf-8 -*-
 
import urllib2
import re
import requests
import sys
 
import urllib
#設置編碼
reload(sys)
sys.setdefaultencoding('utf-8')
#獲得系統編碼格式
type = sys.getfilesystemencoding()
r = urllib.urlopen("http://www.baidu.com")
#將網頁以utf-8格式解析然后轉換為系統默認格式
a = r.read().decode('utf-8').encode(type)
print a

最后輸出效果,中文完美輸出

python打印網頁亂碼的解決方法

關于python打印網頁亂碼的解決方法就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

无锡市| 绥芬河市| 胶南市| 邛崃市| 建水县| 邢台市| 抚州市| 图们市| 休宁县| 文安县| 巴青县| 仲巴县| 突泉县| 彭山县| 包头市| 上犹县| 增城市| 西乌| 广饶县| 洛隆县| 米泉市| 道真| 且末县| 和平区| 衢州市| 卢湾区| 大连市| 都安| 玉屏| 田林县| 澄江县| 固始县| 垦利县| 张家港市| 霍邱县| 南开区| 远安县| 丹东市| 咸阳市| 阜阳市| 巴南区|