亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

數據清洗常用的2個小trick分別是什么

發布時間:2021-12-10 10:39:27 來源:億速云 閱讀:146 作者:柒染 欄目:大數據

今天就跟大家聊聊有關數據清洗常用的2個小trick分別是什么,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

Pandas 巧用 str.splitstr.cat

因為以上兩個方法,直接按列操作,所以省掉一層 for 循環,下面直接看例子。

df = pd.DataFrame({'names':["Geordi La Forge", "Deanna Troi", "Jack"],'IDs':[1,2,3]})
df
 
數據清洗常用的2個小trick分別是什么  
 

列分割

names 列,按照第一個空格分割為兩列:

df["first_name"] = df["names"].str.split(n = 1).str[0]
df["last_name"] = df["names"].str.split(n = 1).str[1]
df
 

結果如下:

數據清洗常用的2個小trick分別是什么  
 

列合并方法 1

分割列搞定,接下來再合并回去,使用 cat 方法:

df["names_copy"] = df["first_name"].str.cat(df["last_name"], sep = " ")
df
 
數據清洗常用的2個小trick分別是什么  

合并兩列得到一個新列 names_copy 搞定!

 

列合并方法 2

還有別的合并方法嗎,直接使用 + 連接字符串:

df["names_copy2"] = df["first_name"] + " "+ df["last_name"]
df
 

效果是一樣的:

數據清洗常用的2個小trick分別是什么  
 

Pandas 多條件篩選可讀性較好的寫法

有特征上百個,根據多個特征篩選 DataFrame 時,如果這么做,可讀性不太友好:

數據清洗常用的2個小trick分別是什么  
df[(df["continent"] == "Europe") & (df["beer_servings"] > 150) & (df["wine_servings"] > 50) & (df["spirit_servings"] < 60)]
 

連續多個篩選條件寫到一行里。

更好可讀性的寫法

cr1 = df["continent"] == "Europe"
cr2 = df["beer_servings"] > 150
cr3 = df["wine_servings"] > 50
cr4 = df["spirit_servings"] < 60

df[cr1 & cr2 & cr3 & cr4]
看完上述內容,你們對數據清洗常用的2個小trick分別是什么有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

罗甸县| 卢龙县| 淅川县| 德阳市| 武邑县| 汶川县| 贺州市| 含山县| 黑龙江省| 工布江达县| 高淳县| 娱乐| 龙南县| 玛纳斯县| 塔河县| 龙门县| 普洱| 开鲁县| 湖口县| 临武县| 中西区| 嘉义县| 兰西县| 通辽市| 临猗县| 苏尼特右旗| 玉环县| 鄂托克旗| 东宁县| 阿拉善盟| 油尖旺区| 康乐县| 伊川县| 盱眙县| 青海省| 贵南县| 嘉荫县| 揭东县| 镶黄旗| 获嘉县| 丹寨县|