您好,登錄后才能下訂單哦!
Python中怎么創建可視化,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
它的速度更快 — 代碼行更少,需要編寫的代碼更少,需要重新加載的庫更少。可視化對于數據分析至關重要,因此沒有理由拒絕嘗試加快生成良好可視化的過程。此外,Pandas在我們想要它繪制的圖中做很多推論,因此它可以在很多情況下可視化我們想要的,而無需顯式聲明它們。
直接整合許多涉及系列和數據幀的方便數據操作功能(如不同的分機和滾動方式)更容易。
實際上,直接從Pandas那里創建地塊更容易在條形圖、堆疊條形圖和水平條形圖之間轉換只是更改參數值的問題。創建子圖并操作子圖也只是幾個字符。Pandas在可視化方面承擔著許多艱苦的工作。
而對于技術:Pandas的繪圖運行在matplotlib基礎設施,并加載其他matplotlib項目或參數在Pandas創建的圖形的頂部可以改善它。相反,Pandas只是提供了一個方便和更直接的界面,將數據連接到可視化。例如,以下數據幀隨機生成,包含四列和十行。
只需用data.plot.bar()來繪制每行每列的值,就可以用data來替換數據幀的名稱。請注意,在語句之后添加分號 () 會從輸出其他打印(例如 , )中刪除單元格。
或者,嘗試添加一個參數stacked=True,這是直接從數據源創建堆疊條形圖的非常簡單的方法。
或者,嘗試使用barhdata.plot.barh(stacked=True)繪制水平條,所有這些變體只需一行代碼就可以輕松創建,因為它們與數據建立了直接流。
可以通過在繪圖的代碼(sns.set_palette(‘magma’))之前添加來更改繪圖的常規調色板。或者,也可以將顏色貼圖參數傳遞到繪圖中。
顯示此類數據的另一種方法是使用data.plot.area()的區域圖。
代碼中的參數可以像通常使用 matplotlib 或海生模型那樣進行調整。在data.plot.area(stacked=False)的情況下,參數(透明度)默認設置為 0.5,但可以手動調整。
直接使用Pandas的主要好處之一是,許多Pandas的有用數據幀操作可以直接使用。例如,data.diff()的結果,它只需將一行與它之前的行之間的差值(因此,第一行中存在 NaN)。這在許多時間序列應用中都很有幫助。
例如,以下代碼,該代碼繪制出差異的數據,并演示各種參數在Pandas繪圖中的用法,本例中為顏色:
Pandas數據處理功能的另一個應用是,它采用平均滾動均值,這是一種常見的統計方法,用于減少數據平均移動窗口的數據的不可信度。
可直接從數據創建各種其他類型的繪圖:
kde或用于密度圖density;
scatter用于散點圖;
hexbin對于六邊形箱圖;
注:盡管在默認情況下 ,如果.plot.scatter()figsize=(x,y)的顏色是灰度,但可以在顏色映射參數中傳遞。所有繪圖都有一個參數,以便控制輸出圖形的大小。在每個繪圖線之后輸入分號 (), 允許在 Jupyter 筆記本中具有多個輸出。
Pandas在為你繪圖時做重擔的一個例子是子圖。通過啟用 ,Pandas根據列自動創建子圖。例如,考慮以下生成的 DataFrame,它有兩列 (和) 以及五行
通常,你需要手動創建兩個子圖。特別是在想要生成多個子圖的情況下,可以想象直接使用Pandas繪圖方法會很有幫助。
餅圖的其他參數包括 ,它將自定義標簽添加到切片中;,指定每個切片的顏色;,確定十進制標簽的百分比和截斷程度;和 ,用于確定標簽的大小。作為直接Pandas繪圖中子圖的便利性的另一個示例,請考慮繪制行數據(使用 時為默認值):
在繪制可視化效果的代碼行中添加參數時(在 ): 后)中考慮結果,Pandas根據布局自動以格式格式化子圖。每個子圖的尺寸由參數確定,該參數指定包含所有子圖的"主圖"的大小。
關于Python中怎么創建可視化問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。