您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關Python數據分析需要解答的三大問題是什么,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
Windows系統并沒有自帶Python工具,需要我們自己搭建環境。對于小白,我們推薦大家安裝Anaconda,一個開源的Python發行版本,安裝和使用都很方便,還自帶大量工具包,簡直貼心。
許多小可愛在搭建環境的時候沒有按要求來,導致后面出現很多問題不得不花較多時間精力去解決,很不方便。這里強調一下兩個點:
1)安裝路徑選擇C盤!
2)如圖兩個advanced options都要勾選!
此外,雖然Mac系統自帶Python工具,也建議使用Mac系統的初學小白安一個Anaconda,會方便很多~
首先將EXCEL文件另存為CSV文件,再調用pandas工具包進行讀取。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# numpy:科學計算工具包
# pandas:數據分析工具包
# malplotlib:圖表繪制工具包
# improt語句:加載工具包
data = pd.read_csv("路徑\\地市級黨委書記數據庫(2000-10).csv",encoding = "gbk",engine = 'python')
print(data)
對于讀取數據時的報錯情況,參考如下解決方案:
1)檢查所有代碼是不是都是英文,特別是標點!
#檢查每一處逗號,單雙引號,括號
2)excel轉csv時,可設置編碼為UTF-8,并更改參數
encoding = 'utf-8'
3)mac系統導出csv時,可以更改參數
encoding = "gb18030"
4)可將文件名改為英文文件名,例如“data.csv”
data.csv
5)設置engine='python'
engine = 'python'
6)在數據量不大的時候,也可以用read_excel, 代碼則是
data=pd.read_excel(‘路徑.xlsx’)
前提是數據放在第一個sheet;如果是第二個sheet,代碼改為
data=pd.read_excel(‘路徑.xlsx’, sheet_name=1)
*讀取sheet_name編號是從0開始的,1代表第二個sheet
matplotlib中文亂碼
也是很常見也很頭大的問題~這里以win10系統,python3.6版本為例講解一下解決步驟:
*部分摘自原答案https://www.zhihu.com/question/25404709/answer/128171562
感謝這位知友:司毅
1)找到matplotlib 配置文件:
import matplotlib
print(matplotlib.matplotlib_fname())
# 示例輸出結果如下:
# D:\Program Files\Python36\Lib\site-packages\matplotlib\mpl-data
2)編輯器打開此文件 matplotlibrc
刪除font.family和font.sans-serif兩行前的#,并在font.sans-serif后添加微軟雅黑字體Microsoft YaHei
3)下載字體:msyh.ttf (微軟雅黑)放在matplotlib 字體文件夾下:
# D:\Program Files\Python36\Lib\site-packages\matplotlib\mpl-data\fonts\ttf
4)刪除.matplotlib/cache里面的兩個緩存字體文件
C:\Users\你的用戶名\.matplotlib
5)重啟Python
以上就是Python數據分析需要解答的三大問題是什么,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。