Pandas 根据日期进行分组
问题背景:有一个分钟级别索引的数据框,需要根据日期进行分组聚合计算。
- 简单的
.groupby('datetime')
无法实现按日期分组。 .groupby(pd.Grouper(level='datetime', freq='D'))
会为原始数据中不存在的日期填充空值(例如,在股票数据中,周末、节假日等非交易日会被填充为空值)。- 如果分组后调用的是
.mean()
,则会出现这个问题。 - 如果分组后调用的是
.transform('mean')
,则不存在这个问题。
- 如果分组后调用的是
本文记录了可以正确根据日期进行分组的方法。