您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關使用pandas怎么計算唯一值,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
1、Series唯一值判斷
s = Series([3,3,1,2,4,3,4,6,5,6]) #判斷Series中的值是否重復,False表示重復 print(s.is_unique) #False #輸出Series中不重復的值,返回值沒有排序,返回值的類型為數組 print(s.unique()) #[3 1 2 4 6 5] print(type(s.unique())) #<class 'numpy.ndarray'> #統計Series中重復值出現的次數,默認是按出現次數降序排序 print(s.value_counts()) ''' 3 3 6 2 4 2 5 1 2 1 1 1 ''' #按照重復值的大小排序輸出頻率 print(s.value_counts(sort=False)) ''' 1 1 2 1 3 3 4 2 5 1 6 2 '''
2、成員資格判斷
a、Series的成員資格
s = Series([5,5,6,1,1]) print(s) ''' 0 5 1 5 2 6 3 1 4 1 ''' #判斷矢量化集合的成員資格,返回一個bool類型的Series print(s.isin([5])) ''' 0 True 1 True 2 False 3 False 4 False ''' print(type(s.isin([5]))) #<class 'pandas.core.series.Series'> #通過成員資格方法選取Series中的數據子集 print(s[s.isin([5])]) ''' 0 5 1 5 '''
b、DataFrame的成員資格
a = [[3,2,6],[2,1,4],[6,2,5]] data = DataFrame(a,index=["a","b","c"],columns=["one","two","three"]) print(data) ''' one two three a 3 2 6 b 2 1 4 c 6 2 5 ''' #返回一個bool的DataFrame print(data.isin([1])) ''' one two three a False False False b False True False c False False False ''' #選取DataFrame中值為1的數,其他的為NaN print(data[data.isin([1])]) ''' one two three a NaN NaN NaN b NaN 1.0 NaN c NaN NaN NaN ''' #將NaN用0進行填充 print(data[data.isin([1])].fillna(0)) ''' one two three a 0.0 0.0 0.0 b 0.0 1.0 0.0 c 0.0 0.0 0.0 '''
關于使用pandas怎么計算唯一值就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。