您好,登錄后才能下訂單哦!
這篇文章主要介紹了怎么在Python中利用dataframe將出生日期轉化為年齡,此處通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考價值,需要的朋友可以參考下:
Python是一種跨平臺的、具有解釋性、編譯性、互動性和面向對象的腳本語言,其最初的設計是用于編寫自動化腳本,隨著版本的不斷更新和新功能的添加,常用于用于開發獨立的項目和大型項目。
# -*- coding: utf-8 -*- import pandas as pd from pandas import Series, DataFrame import numpy as np import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline data = {'birth': ['10/8/00', '7/21/93', '6/14/01', '5/18/99', '1/5/98']} frame = DataFrame(data) frame
從數據來看,'10/8/00'之類的數,最左邊的數表示月份,中間的數表示日,最后的數表示年度。
實際上我們在分析時并不需要人的出生日期,而是需要年齡,不同的年齡階段會有不同的狀態,比如收入、健康、居住條件等等,且能夠很好地把不同樣本的差異性進行大范圍的劃分,而不是像出生日期那樣包含信息量過大且在算法訓練時不好作為有效數據進行訓練,age是一個很好地特征工程指示變量。
那如何把上述birth數據變為年齡age呢?
在這里用到datetime這個庫,如下:
(1)首先把birth轉化為標準時間格式
frame['birth'] = pd.to_datetime(frame['birth']) frame
(2)獲取當前時間的年份,并減去birth的年份
import datetime as dt now_year =dt.datetime.today().year #當前的年份 frame['age']=now_year-frame.birth.dt.year frame
在這里使用了dt.datetime.today().year
來獲取當前日期的年份,然后將birth數據中的年份數據提取出來(frame.birth.dt.year
),兩者相減就得到需要的年齡數據,如下:
到此這篇關于怎么在Python中利用dataframe將出生日期轉化為年齡的文章就介紹到這了,更多相關怎么在Python中利用dataframe將出生日期轉化為年齡的內容請搜索億速云以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持億速云!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。