您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關Python Pandas如何獲取列匹配特定值的行的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
給定一個帶有列"BoolCol"的DataFrame,如何找到滿足條件"BoolCol" == True的DataFrame
的索引
目前有迭代的方式來做到這一點:
for i in range(100,3000): if df.iloc[i]['BoolCol']== True: print i,df.iloc[i]['BoolCol']
這雖然可行,但不是標準的 Pandas 方式。經過一番研究,我目前正在使用這個代碼:
df[df['BoolCol'] == True].index.tolist()
這個給了我一個索引列表,但跟我想要的不匹配,當檢查:
df.iloc[i]['BoolCol']
其結果實際上是False!
如何使用正確的 Pandas 方式做到這一點?
最佳解決方法
df.iloc[i]返回df的第i行。 i不引用索引標簽,i是從0開始的索引。
相反,屬性index返回實際的索引標簽,而不是數字row-indices:
df.index[df['BoolCol'] == True].tolist()
或者等同地,
df.index[df['BoolCol']].tolist()
通過使用帶有"unusual"索引的DataFrame,可以非常清楚地看到差異:
df = pd.DataFrame({'BoolCol': [True, False, False, True, True]}, index=[10,20,30,40,50]) In [53]: df Out[53]: BoolCol 10 True 20 False 30 False 40 True 50 True [5 rows x 1 columns] In [54]: df.index[df['BoolCol']].tolist() Out[54]: [10, 40, 50]
如果你想使用索引,
In [56]: idx = df.index[df['BoolCol']] In [57]: idx Out[57]: Int64Index([10, 40, 50], dtype='int64')
那么您可以使用loc而不是iloc選擇行:
In [58]: df.loc[idx] Out[58]: BoolCol 10 True 40 True 50 True [3 rows x 1 columns]
請注意,loc也可以接受布爾數組:
In [55]: df.loc[df['BoolCol']] Out[55]: BoolCol 10 True 40 True 50 True [3 rows x 1 columns]
如果您有一個布爾數組mask,并且需要序數索引值,則可以使用np.flatnonzero來計算它們:
In [110]: np.flatnonzero(df['BoolCol']) Out[112]: array([0, 3, 4])
使用df.iloc按順序索引選擇行:
In [113]: df.iloc[np.flatnonzero(df['BoolCol'])] Out[113]: BoolCol 10 True 40 True 50 True python pandas
1、簡單易用,與C/C++、Java、C# 等傳統語言相比,Python對代碼格式的要求沒有那么嚴格;2、Python屬于開源的,所有人都可以看到源代碼,并且可以被移植在許多平臺上使用;3、Python面向對象,能夠支持面向過程編程,也支持面向對象編程;4、Python是一種解釋性語言,Python寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序;5、Python功能強大,擁有的模塊眾多,基本能夠實現所有的常見功能。
感謝各位的閱讀!關于“Python Pandas如何獲取列匹配特定值的行”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。