pandas函数:rolling的使用

戴冠英

Python|2023-8-13|最后更新: 2023-8-14|

1,什么是rolling函数?

在Pandas中,rolling函数是Series和DataFrame对象的一个方法,它允许我们创建一个滑动窗口,并在该窗口上执行各种统计计算。该函数主要用于时间序列数据,但同样适用于其他一维数据。

2,如何使用rolling函数?

rolling函数的一般语法如下:
  • DataFrame:要进行滚动计算的DataFrame对象或Series对象。
  • window:指定滑动窗口的大小,可以是一个整数,表示窗口的大小;也可以是一个字符串,表示时间窗口的大小(例如:"2D"表示2天)。
  • min_periods(可选):指定窗口中非NaN值的最小数量。如果窗口中的非NaN值数量小于min_periods,则结果为NaN。
注意:这里window = 1, min_periods = 1的时候,就等于原来的值。
你觉得这个是废话吗?
并不是!
因为有的时候我们处理数据,会写成一个函数,那么这样就很方便,例如:
这样我们就可以轻松写成函数了~
下面,我们介绍一些rolling函数的常用统计计算:
  1. 滚动平均值(Rolling Mean)
滚动平均值是rolling函数中最常用的功能之一,它可以帮助我们平滑时间序列数据,去除噪声,更好地观察趋势。
  1. 滚动求和(Rolling Sum)
滚动求和可以用于累积计算,比如累计收益、累积销量等。
  1. 滚动最大值和最小值(Rolling Maximum and Minimum)
滚动最大值和最小值有助于寻找局部极值点,或者在一段时间内的峰值和谷值。
  1. 滚动标准差(Rolling Standard Deviation)
滚动标准差可以帮助我们观察数据的波动情况。

3,大坑

  • 在使用rolling函数时,需要注意数据的顺序,确保时间序列按照时间先后顺序排序。