您好,登錄后才能下訂單哦!
這篇文章給大家介紹Python如何處理運動員信息的分組與聚合,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
代碼:
import pandas as pd f = open('運動員信息表.csv') data=pd.read_csv(f,skiprows=0,header=0) print(data)
運行結果:
首先使用pd.read_csv(f,skiprows=0,header=0)
進行數據的讀取,并且將數據轉換成為dataframe的格式給對象,做初始化,方便后面進行數據的分析。
代碼:
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"]) print(sex.mean())
運行結果:
首先我們先把數據提取出來做個分組,先把"年齡(歲)",“身高(cm)”,"體重(kg)"這三行數據提取出來再根據性別進行分組。
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])
然后再調用mean()
求平均值,求出男籃、女籃運動員的平均年齡、身高、體重。
代碼:
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"]) basketball_male=dict([x for x in sex])['男'] basketball_male #求極差 def range_data_group(arr): return arr.max()-arr.min() #進行每列不同的聚合 basketball_male.agg({ "年齡(歲)":range_data_group,"身高(cm)":range_data_group,"體重(kg)":range_data_group })
運行結果:
首先提取數據:
單行循環提取數據,dict([x for x in sex])
在循環體內的語句只有一行的情況的下,可以簡化for循環的書寫。定義一個函數def range_data_group(arr):
求極差;
極差的求法:使用最大值減去最小值。就得到極差。
agg()函數:DataFrame.agg(*func*,*axis = 0*,* args*,*** kwargs* )*
func
: 函數,函數名稱,函數列表,字典{‘行名/列名',‘函數名'}
使用指定軸上的一個或多個操作進行聚合。
需要注意聚合函數操作始終是在軸(默認是列軸,也可設置行軸)上執行,不同于 numpy聚合函數
最后我們可以得到三列數據:分別對應"年齡(歲)",“身高(cm)”,“體重(kg)”。
代碼:
data["體質指數"]=0 data
運行結果:
添加一行體重指數:data[“體質指數”]=0
代碼:
# 計算bmi數值 def outer(num): def bminum(sumbim): weight=data["身高(cm)"] height=data["體重(kg)"] sumbim=weight/(height/100)**2 return num+sumbim return bminum
將該行數據添加上去:
代碼:
# 調用函數 bimdata=data["體質指數"] data["體質指數"]=data[["體質指數"]].apply(outer(bimdata)) data
運行結果:
編寫函數計算bmi
數值 outer(num);
然后再使用apply的方法將自定義的函數應用到"體質指數"這一列。然后計算出該列的值之后進行賦值。
data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))
97622)]
編寫函數計算bmi
數值 outer(num)
;然后再使用apply
的方法將自定義的函數應用到"體質指數"這一列。然后計算出該列的值之后進行賦值。
data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))
關于Python如何處理運動員信息的分組與聚合就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。