在Python中,可以使用groupby()
函數和sum()
函數對多列進行分組求和。
首先,需要導入pandas
庫:
import pandas as pd
然后,創建一個包含多列的數據集,并對這些列進行分組求和。假設我們有一個名為data
的數據集,其中包含’列1’、'列2’和’列3’這三列:
data = {'列1': [1, 2, 3, 1, 2, 3],
'列2': [4, 5, 6, 4, 5, 6],
'列3': [7, 8, 9, 7, 8, 9]}
df = pd.DataFrame(data)
接下來,使用groupby()
函數將數據集按照指定的列進行分組,并使用sum()
函數計算每個分組的和:
grouped = df.groupby(['列1', '列2']).sum()
這將得到一個以’列1’和’列2’為索引的新數據集,其中包含每個分組的和。
如果只想對某一列進行求和,可以按照以下方式進行操作:
sum_column = df['列1'].groupby(df['列2']).sum()
這將得到一個以’列2’為索引的新數據集,其中包含’列1’按照’列2’分組后的求和結果。