亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

duplicated()函數在Pandas庫中的具體用法是什么

小樊
89
2024-09-12 18:31:51
欄目: 編程語言

duplicated() 函數在 Pandas 庫中用于檢查 DataFrame 或 Series 中的重復項

以下是 duplicated() 函數的基本用法:

  1. 對于一個 Pandas Series:
import pandas as pd

data = pd.Series(['A', 'B', 'A', 'C', 'B'])
duplicates = data.duplicated()

print(duplicates)

輸出結果將會是:

0    False
1    False
2     True
3    False
4     True
dtype: bool
  1. 對于一個 Pandas DataFrame:
import pandas as pd

data = {'Column1': ['A', 'B', 'A', 'C', 'B'],
        'Column2': [1, 2, 1, 3, 2]}

df = pd.DataFrame(data)
duplicates = df.duplicated()

print(duplicates)

輸出結果將會是:

0    False
1    False
2     True
3    False
4     True
dtype: bool

你還可以使用 duplicated() 函數的參數來自定義重復項檢測的行為。例如,你可以設置 keep 參數來指定保留哪個重復項。默認情況下,keep 參數設置為 'first',表示保留第一個出現的重復項,并將其他重復項標記為 True。你還可以將 keep 設置為 'last',這樣最后一個出現的重復項將被保留。此外,你還可以將 keep 設置為 False,這樣所有重復項都將被標記為 True

例如:

import pandas as pd

data = {'Column1': ['A', 'B', 'A', 'C', 'B'],
        'Column2': [1, 2, 1, 3, 2]}

df = pd.DataFrame(data)
duplicates = df.duplicated(keep='last')

print(duplicates)

輸出結果將會是:

0     True
1     True
2    False
3    False
4    False
dtype: bool

0
新宁县| 涪陵区| 竹山县| 偃师市| 建宁县| 抚松县| 玉溪市| 石棉县| 南安市| 靖远县| 蒲江县| 高阳县| 南乐县| 阿勒泰市| 柘城县| 康平县| 于都县| 阿合奇县| 平邑县| 兴海县| 清涧县| 延边| 柯坪县| 轮台县| 客服| 木里| 来宾市| 祁东县| 昌邑市| 郓城县| 金湖县| 和平区| 株洲市| 宁安市| 北辰区| 双峰县| 绥中县| 望谟县| 清丰县| 迭部县| 南丰县|