您好,登錄后才能下訂單哦!
這篇文章給大家介紹怎么在Python中使用numpy清洗數據,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
Python主要應用于:1、Web開發;2、數據科學研究;3、網絡爬蟲;4、嵌入式應用開發;5、游戲開發;6、桌面應用開發。
Anaconda中已經集成了NumPy,可以直接使用。如果想要自行安裝的話,可以使用流行的Python
包安裝程序 pip 來安裝 NumPy,目前使用的是Anaconde的環境進行學習和使用這個庫
CMD :pip install numpy
或者使用清華源的鏡像庫:pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
(直接復制可用)
如果想查看這個庫的版本:
import numpy as np np.__version__
其實很多其他庫也可以用這個方法進行查看庫的版本
Numpy的操作對象是一個ndarray,所以在使用這個庫進行計算的時候需要將數據進行轉化
np.array 可以把 list,tuple或者其他的序列模式的數據轉創建為 ndarray,默認創建一個新的
ndarray
我們會發現原來數據里面有int, float型的數據都被轉換成相同的類型了,統一轉變成float型的數據了,因為Numpy是要求array里面的數據類型是一致的
Numpy不僅可以生成一維數組,也可以生成多維數組。
比如,可以生成如下的二維數組:
數組的運算時對應位置的元素進行簡單的四則運算
這里需要注意的是,數組x和數組y的元素個數是相同的(兩者均是元素個數為3的一維數組)
當兩者元素個數相同時,可以對各個元素進行算術運算。如果元素個數不同,則會報錯,所以保
持元素個數一致非常重要。
此外,Numpy數組不僅可以進行對應元素的算術運算,還可以和單一的數值(標量)組合起來進
行運算(這個功能也被稱為廣播,后面會詳細介紹),比如:
會把數據轉成數組默認的float的數據類型
我們先定義一個數組
如果數組的量級比較大,對于計算的時候只知道其他的一個維度數字,則可以使用下面的-1,作為占位符,會自動幫你補齊另外一個維度的信息
除此之外,還有一種比較常用的數組拉平方法, m.flatten()以及m.ravel(),這兩種方法類似
可以將這個二維的數組看成一個矩陣,3行四列, 通過數字的下標索引進行提取數字,這里的切片操作還是左閉右開的
術語廣播是指 NumPy 在算術運算期間處理不同形狀的數組的能力。
廣播可以簡單理解為用于不同大小數組的計算(加、減、乘、除等)的一組規則。
如果數組的形狀相同,則對相應元素逐個計算,但是如果數組的維度不相同,就需要用到廣播機制
Numpy的廣播遵循一組嚴格的規則:
規則1:如果兩個數組的維度數不相同,那么小維度數組的形狀將會在最左邊補1規則2:如果兩個數組的形狀在任何一個維度上都不匹配,那么數組的形狀會沿著維度為1的維度擴展以匹配另外一個數組的形狀規則3:如果兩個數組的形狀在任何一個維度上都不匹配并且沒有任何一個維度為1,則會引 發異常無法廣播
關于怎么在Python中使用numpy清洗數據就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。