您好,登錄后才能下訂單哦!
pandas中怎么處理日期類型數據,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
pandas 的日期/時間類型有如下幾種:
Concept | Scalar Class | Array Class | pandas Data Type | Primary Creation Method |
---|---|---|---|---|
Date times | Timestamp | DatetimeIndex | datetime64[ns] or datetime64[ns, tz] | to_datetime or date_range |
Time deltas | Timedelta | TimedeltaIndex | timedelta64[ns] | to_timedelta or timedelta_range |
Time spans | Period | PeriodIndex | period[freq] | Period or period_range |
Date offsets | DateOffset | None | None | DateOffset |
首先獲取數據,并且將 DataFrame 的 date 列轉換成 datetime 類型:
df1 = pd.read_csv('https://raw.githubusercontent.com/stonewm/python-practice-projects/master/pandas%20sample%20data/sample-salesv3.csv') df1['date'] = pd.to_datetime(df1['date']) # convert date column to datetime df1.head()
也可以在 read_csv() 方法中,通過 parse_dates 參數直接將某些列轉換成 datetime64 類型:
df1 = pd.read_csv('sample-salesv3.csv', parse_dates=['date'])
我們據此銷售數據,按月份、按季度統計 sku 的銷售金額。
pandas 的 pandas.Series.dt 可以獲得日期/時間類型的相關信息。比如
df1['date'].dt.year df1['date'].dt.month df1['date'].dt.quarter
但這些類型返回值為 int 類型,作為統計的字段,我們更希望是 2014-04 這樣的格式,有兩個方法:
# 方法 1 df1['year_month'] = df1['date'].apply(lambda x : x.strftime('%Y-%m'))
第二種方法:
df1['period'] = df1['date'].dt.to_period('M')
第二種方法使用起來更加簡單,參數 M 表示月份,Q 表示季度,A 表示年度,D 表示按天,這幾個參數比較常用。
新增了一列之后,做出數據透視表:
import numpy as np pivot = pd.pivot_table(df1, index=['sku'], columns=['period'], values=['ext price'], aggfunc=np.sum) pivot.head()
再做一個按季度統計的數據透視表:
df1['quarter'] = df1['date'].dt.to_period('Q') quarter_pivot = pd.pivot_table(df1, index=['sku'], columns=['quarter'], values=['ext price'], aggfunc=np.sum)
關于pandas中怎么處理日期類型數據問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。