您好,登錄后才能下訂單哦!
利用numpy庫
(缺點:有缺失值就無法讀取)
讀:
import numpy my_matrix = numpy.loadtxt(open("1.csv","rb"),delimiter=",",skiprows=0)
寫:
numpy.savetxt('2.csv', my_matrix, delimiter = ',')
可能遇到的問題:
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position
原因是文件路徑名中含有轉義字符,將路徑中的\換成\即可。
利用pandas庫
讀:(可以處理缺失值)
>>> import pandas as pd >>> df = pd.read_csv('D:\Python\\l\B_train1.csv') >>> df.values >>> df.as_matrix(columns=None)
寫:(將dataFrame直接寫入)
>>> testB = test[test.intersection_id.isin(["B"])] >>> pd.DataFrame.to_csv(testB,"D:\Python\\k\\t5B.csv") #testB是個dataFrame
利用sklearn包中的Imputer處理缺失值
>>> m = df.as_matrix(columns=None) >>> from sklearn.preprocessing import Imputer >>> imp = Imputer(missing_values='NaN', strategy='mean', axis=0) >>> imp.fit(m) Imputer(axis=0, copy=True, missing_values='NaN', strategy='mean', verbose=0) >>> imp.transform(m)
以上這篇python 讀取.csv文件數據到數組(矩陣)的實例講解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。