您好,登錄后才能下訂單哦!
本文小編為大家詳細介紹“python數據實例分析”,內容詳細,步驟清晰,細節處理妥當,希望這篇“python數據實例分析”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。
假設我們的數據是這樣的,無異常無缺失值,下面我通過幾個問題,我們來練習用Pandas進行探索性數據分析~
year | name | salary | title |
---|---|---|---|
2001 | aa | 1500 | first |
2002 | bb | 4300 | first |
2003 | cc | 7000 | second |
2001 | dd | 5000 | third |
我們將數據讀取后命名為df
import pandas as pd
df['salary'].max()
同樣的,最低(min)、平均(mean)。
突然想到了SQL,是不是一句話的事情,select...from...where... 當然,我們的pandas也是一句話的事情:
df[df['name']=='bb']['salary']
那我們就定位到收入最高的行~
df[df['salary']==df['salary'].max()]
# or
df.loc[df['salary'].idxmax()]
是不是自然而然想到了分組,group by?
df.groupby('year').mean()['salary']
這里使用nunique()函數,之前有一個小伙伴和我交流中就發現沒有搞懂nunique()函數和unique()函數之間的區別,現在應該懂了吧?
df['title'].nunique()
讀到這里,這篇“python數據實例分析”文章已經介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領會,如果想了解更多相關內容的文章,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。