dropna()
和notnull()
是pandas庫中用于處理缺失值的函數,它們的用法和功能有一些區別。
dropna()
是pandas庫中DataFrame和Series對象的一個方法,用于刪除含有缺失值的行或列。它的主要功能是過濾掉包含缺失值的行或列,返回一個新的DataFrame或Series對象。默認情況下,dropna()
會刪除包含任何缺失值的行或列,也可以通過參數指定刪除方式。例如,可以通過設置axis
參數為1來刪除包含缺失值的列,通過設置subset
參數來指定刪除含有缺失值的特定列。
示例代碼:
import pandas as pd
# 創建一個包含缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用dropna()刪除含有缺失值的行
df_dropna = df.dropna()
print(df_dropna)
輸出結果:
A B
0 1.0 5.0
3 4.0 8.0
notnull()
是pandas庫中DataFrame和Series對象的一個方法,用于判斷每個元素是否為非空值。它返回一個布爾值的DataFrame或Series,其中為非空值的元素對應的位置為True
,否則為False
。
示例代碼:
import pandas as pd
# 創建一個包含缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用notnull()判斷每個元素是否為非空值
df_notnull = df.notnull()
print(df_notnull)
輸出結果:
A B
0 True True
1 True False
2 False True
3 True True
總結一下,dropna()
主要用于刪除含有缺失值的行或列,而notnull()
主要用于判斷每個元素是否為非空值。