从时间提取时间限制吗?
你这个问题好,我正好最近研究了下这个问题,写了一个小demo程序,利用Python的pandas库来完成你的需求(这个库是python做数据分析用的,里面有函数可以直接进行时间段处理) 。
首先引入pandas库,然后导入数据,这里我用百度最近一周的搜索数据来做测试(来自百度分析师),数据量不大所以直接全量导入,如果要大规模的数据,可以分条导入。
data=pd.read_csv('C:/Users/Administrator/Desktop/百度关键词热搜榜(关键字).csv',encoding='utf-8')
之后就是重点了,需要新建一个时间序列,pandas中有专门用来做时间序列的Series对象,我们新建一个系列,名字叫做time,类型为datetime64[ns],即时间序列对象,然后给这个序列赋值就行了。
time_series=pd.Series(data=['2015-04-07','2015-04-08','2015-04-10', '2015-04-13','2015-04-20'],dtype=‘datetime64[ns]’)
接下来就简单了,只需要使用panda中的shift方法就可以了,这个方法的作用是把时间序列中每个元素向后移动一个位置(也就是把今天的元素变成昨天的,把昨天的变成前天的,以此类推),我们只要新建一个列,把新的时间序列放在后面,然后用shift方法把每一个元素都移一位即可。
新列的时间格式按照自己的需求来设定。
最后经过简单的计算和整理,我们就可以得到自己所需的结果了。