亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

pandas DataFrame創建方法的方式

發布時間:2020-09-15 10:50:30 來源:腳本之家 閱讀:177 作者:蒙面的普羅米修斯 欄目:開發技術

在pandas里,DataFrame是最經常用的數據結構,這里總結生成和添加數據的方法:

①、把其他格式的數據整理到DataFrame中;
②在已有的DataFrame中插入N列或者N行。

1. 字典類型讀取到DataFrame(dict to DataFrame)

假如我們在做實驗的時候得到的數據是dict類型,為了方便之后的數據統計和計算,我們想把它轉換為DataFrame,存在很多寫法,這里簡單介紹常用的幾種:

方法一:直接使用pd.DataFrame(data=test_dict)即可,括號中的data=寫不寫都可以,具體如下:

test_dict = {'id':[1,2,3,4,5,6],'name':['Alice','Bob','Cindy','Eric','Helen','Grace '],'math':[90,89,99,78,97,93],'english':[89,94,80,94,94,90]}
#[1].直接寫入參數test_dict
test_dict_df = pd.DataFrame(test_dict)
#[2].字典型賦值
test_dict_df = pd.DataFrame(data=test_dict)

那么,我們就得到了一個DataFrame,如下:

pandas DataFrame創建方法的方式

應該就是這個樣子了。

方法二:使用from_dict方法:

test_dict_df = pd.DataFrame.from_dict(test_dict)

結果是一樣的,不再重復貼圖。

其他方法:如果你的dict變量很小,例如{'id':1,'name':'Alice'},你想直接寫到括號里:

test_dict_df = pd.DataFrame({'id':1,'name':'Alice'}) # wrong style

這樣是不行的,會報錯ValueError: If using all scalar values, you must pass an index,是因為如果你提供的是一個標量,必須還得提供一個索引Index,所以你可以這么寫:

test_dict_df = pd.DataFrame({'id':1,'name':'Alice'},pd.Index(range(1)))

后面的可以寫多個pd.Index(range(3),就會生成三行一樣的,是因為前面的dict型變量只有一組值,如果有多個,后面的Index必須跟前面的數據組數一致,否則會報錯:

pd.DataFrame({'id':[1,2],'name':['Alice','Bob']},pd.Index(range(2))) #must be 2 in range function.

關于選擇列,有些時候我們只需要選擇dict中部分的鍵當做DataFrame的列,那么我們可以使用columns參數,例如我們只選擇'id','name'列:

test_dict_df = pd.DataFrame(data=test_dict,columns=['id','name']) #only choose 'id' and 'name' columns

這里就不在多寫了,后續變更顏色添加內容。

2. csv文件構建DataFrame(csv to DataFrame)

我們實驗的時候數據一般比較大,而csv文件是文本格式的數據,占用更少的存儲,所以一般數據來源是csv文件,從csv文件中如何構建DataFrame呢? txt文件一般也能用這種方法。

方法一:最常用的應該就是pd.read_csv('filename.csv')了,用 sep指定數據的分割方式,默認的是','

df = pd.read_csv('./xxx.csv')

如果csv中沒有表頭,就要加入head參數

3. 在已有的DataFrame中,增加N列或者N行

加入我們已經有了一個DataFrame,如下圖:

pandas DataFrame創建方法的方式

3.1 添加列

此時我們又有一門新的課physics,我們需要為每個人添加這門課的分數,按照Index的順序,我們可以使用insert方法,如下:

new_columns = [92,94,89,77,87,91]
test_dict_df.insert(2,'pyhsics',new_columns)
#test_dict_df.insert(2,'pyhsics',new_columns,allow_duplicates=True)

此時,就得到了添加好的DataFrame,需要注意的是DataFrame默認不允許添加重復的列,但是在insert函數中有參數allow_duplicates=True,設置為True后,就可以添加重復的列了,列名也是重復的:

pandas DataFrame創建方法的方式

3.2 添加行

此時我們又來了一位新的同學Iric,需要在DataFrame中添加這個同學的信息,我們可以使用loc方法:

new_line = [7,'Iric',99]
test_dict_df.loc[6]= new_line

但是十分注意的是,這樣實際是改的操作,如果loc[index]中的index已經存在,則新的值會覆蓋之前的值。

當然也可以把這些新的數據構建為一個新的DataFrame,然后兩個DataFrame拼起來。可以用append方法,不過不太會用,提供一種方法:

test_dict_df.append(pd.DataFrame([new_line],columns=['id','name','physics']))

本想一口氣把CURD全寫完,沒想到寫到這里就好累。。。其他后續新開篇章在寫吧。

相關代碼:(https://github.com/dataSnail/blogCode/blob/master/python_curd/python_curd_create.ipynb)(在DataFrame中刪除N列或者N行)(在DataFrame中查詢某N列或者某N行)(在DataFrame中修改數據)

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

梓潼县| 兴海县| 万宁市| 固镇县| 特克斯县| 建始县| 湘西| 平果县| 铜陵市| 晋中市| 峨眉山市| 卓资县| 马山县| 英吉沙县| 武平县| 昭觉县| 天峻县| 澳门| 扎囊县| 桃江县| 望城县| 东源县| 凤山县| 双桥区| 蒲城县| 隆安县| 秭归县| 台安县| 耿马| 雅安市| 凤冈县| 菏泽市| 广安市| 民乐县| 什邡市| 郑州市| 类乌齐县| 竹山县| 青海省| 长兴县| 双牌县|