你可以使用pandas庫中的groupby函數來按某一列拆分數據。
以下是一個示例代碼:
import pandas as pd
# 創建一個示例數據集
data = {
'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Age': [20, 25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
# 按照City列拆分數據
grouped = df.groupby('City')
# 遍歷每個分組
for city, group in grouped:
print(city)
print(group)
print()
輸出結果:
London
Name Age City
1 Nick 25 London
4 Nick 40 London
New York
Name Age City
0 Tom 20 New York
3 Tom 35 New York
Paris
Name Age City
2 John 30 Paris
5 John 45 Paris
以上示例代碼中,我們創建了一個包含姓名(Name)、年齡(Age)、城市(City)的數據集,并按照城市(City)列進行拆分。然后,使用groupby函數進行分組,遍歷每個分組并打印出來。
你可以根據需要對每個分組進行其他操作,例如計算統計量、應用自定義函數等。