pandas时间序列之如何将int转换成datetime格式

作者:qq_39817865 时间:2023-03-09 07:50:34 

将int转换成datetime格式

原始时间格式

users['timestamp_first_active'].head()

原始结果:

0 20090319043255
1 20090523174809
2 20090609231247
3 20091031060129
4 20091208061105
Name: timestamp_first_active, dtype: object

错误的转换

pd.to_datetime(sers['timestamp_first_active'])

错误的结果类似这样:

0 1970-01-01 00:00:00.020201010
1 1970-01-01 00:00:00.020200920
Name: time, dtype: datetime64[ns]

正确的做法

先将int转换成str ,再转成时间:

users['timestamp_first_active']=users['timestamp_first_active'].astype('str')
users['timestamp_first_active']=pd.to_datetime(users['timestamp_first_active'])

pandas 时间数据处理

转化时间类型

to_datetime()方法

to_datetime()方法支持将 int, float, str, datetime, list, tuple, 1-d array, Series, DataFrame/dict-like 类型的数据转化为时间类型

import pandas as pd

# str ---> 转化为时间类型:
ret = pd.to_datetime('2022-3-9')
print(ret)
print(type(ret))
"""
2022-03-09 00:00:00
<class 'pandas._libs.tslibs.timestamps.Timestamp'>   ---pandas中默认支持的时间点的类型
"""

# 字符串的序列 --->转化成时间类型:
ret = pd.to_datetime(['2022-3-9', '2022-3-8', '2022-3-7', '2022-3-6'])
print(ret)
print(type(ret))  
"""
DatetimeIndex(['2022-03-09', '2022-03-08', '2022-03-07', '2022-03-06'], dtype='datetime64[ns]', freq=None)
<class 'pandas.core.indexes.datetimes.DatetimeIndex'> ----pandas中默认支持的时间序列的类型
"""
# dtype = 'datetime64[ns]' ----> numpy中的时间数据类型!

DatetimeIndex()方法

DatetimeIndex()方法支持将一维 类数组( array-like (1-dimensional) )转化为时间序列

# pd.DatetimeIndex 将 字符串序列 转化为 时间序列
ret = pd.DatetimeIndex(['2022-3-9', '2022-3-8', '2022-3-7', '2022-3-6'])
print(ret)
print(type(ret))
"""
DatetimeIndex(['2022-03-09', '2022-03-08', '2022-03-07', '2022-03-06'], dtype='datetime64[ns]', freq=None)
<class 'pandas.core.indexes.datetimes.DatetimeIndex'>
"""

生成时间序列

使用date_range()方法可以生成时间序列。

时间序列一般不会主动生成,往往是在发生某个事情的时候,同时记录一下发生的时间!

ret = pd.date_range(
   start='2021-10-1',  # 开始点
   # end='2022-1-1',  # 结束点
   periods=5,  # 生成的元素的个数 和结束点只需要出现一个即可!
   freq='W',  # 生成数据的步长或者频率, W表示Week(星期)
)
print(ret)
"""
DatetimeIndex(['2021-10-03', '2021-10-10', '2021-10-17', '2021-10-24', '2021-10-31'],
             dtype='datetime64[ns]', freq='W-SUN')
"""

提取时间属性

使用如下数据作为初始数据(type:<class &lsquo;pandas.core.frame.DataFrame&rsquo;>):

pandas时间序列之如何将int转换成datetime格式

# 转化为 pandas支持的时间序列之后再提取时间属性!
data.loc[:, 'time_list'] = pd.to_datetime(data.loc[:, 'time_list'])

# 可以通过列表推导式来获取时间属性
# 年月日
data['year'] =  [tmp.year for tmp in data.loc[:, 'time_list']]
data['month'] = [tmp.month for tmp in data.loc[:, 'time_list']]
data['day'] =   [tmp.day for tmp in data.loc[:, 'time_list']]
# 时分秒
data['hour'] =   [tmp.hour for tmp in data.loc[:, 'time_list']]
data['minute'] = [tmp.minute for tmp in data.loc[:, 'time_list']]
data['second'] = [tmp.second for tmp in data.loc[:, 'time_list']]
# 日期
data['date'] = [tmp.date() for tmp in data.loc[:, 'time_list']]
# 时间
data['time'] = [tmp.time() for tmp in data.loc[:, 'time_list']]
print(data)

pandas时间序列之如何将int转换成datetime格式

# 一年中的第多少周
data['week'] = [tmp.week for tmp in data.loc[:, 'time_list']]

# 一周中的第多少天
data['weekday'] = [tmp.weekday() for tmp in data.loc[:, 'time_list']]

# 季度
data['quarter'] = [tmp.quarter for tmp in data.loc[:, 'time_list']]

# 一年中的第多少周 ---和week是一样的
data['weekofyear'] = [tmp.weekofyear for tmp in data.loc[:, 'time_list']]

# 一周中的第多少天 ---和weekday是一样的
data['dayofweek'] = [tmp.dayofweek for tmp in data.loc[:, 'time_list']]

# 一年中第 多少天
data['dayofyear'] = [tmp.dayofyear for tmp in data.loc[:, 'time_list']]

# 周几---返回英文全拼
data['day_name'] = [tmp.day_name() for tmp in data.loc[:, 'time_list']]

# 是否为 闰年---返回bool类型
data['is_leap_year'] = [tmp.is_leap_year for tmp in data.loc[:, 'time_list']]

print('data:\n', data)

pandas时间序列之如何将int转换成datetime格式

dt属性

Pandas还有dt属性可以提取时间属性。

data['year'] = data.loc[:, 'time_list'].dt.year
data['month'] = data.loc[:, 'time_list'].dt.month
data['day'] = data.loc[:, 'time_list'].dt.day

print('data:\n', data)

pandas时间序列之如何将int转换成datetime格式

计算时间间隔

# 计算时间间隔!
ret = pd.to_datetime('2022-3-9 10:08:00') - pd.to_datetime('2022-3-8')
print(ret)  # 1 days 10:08:00
print(type(ret))  # <class 'pandas._libs.tslibs.timedeltas.Timedelta'>
print(ret.days)# 1

计算时间推移

配合Timedelta()方法可计算时间推移

Timedelta 中支持的参数 weeks, days, hours, minutes, seconds, milliseconds, microseconds, nanoseconds

res = pd.to_datetime('2022-3-9 10:08:00') + pd.Timedelta(weeks=5)
print(res)# 2022-04-13 10:08:00
print(type(res))# <class 'pandas._libs.tslibs.timestamps.Timestamp'>
print(pd.Timedelta(weeks=5))# 35 days 00:00:00

获取当前机器的支持的最大时间和最小时间

# 获取当前机器的支持的最大时间和 最小时间
print('max :',pd.Timestamp.max)
print('min :',pd.Timestamp.min)
"""
max : 2262-04-11 23:47:16.854775807
min : 1677-09-21 00:12:43.145225
"""

来源:https://blog.csdn.net/qq_39817865/article/details/108848346

标签:pandas,时间序列,int,datetime
0
投稿

猜你喜欢

  • pandas学习之df.set_index的具体使用

    2021-11-12 07:35:20
  • mysql 5.7.18 免安装版window配置方法

    2024-01-14 15:03:45
  • sql无效字符 执行sql语句报错解决方案

    2024-01-13 01:40:26
  • MySQL 优化设置步骤

    2024-01-26 16:51:37
  • asp 实现当有新信息时播放语音提示的效果

    2011-03-31 11:00:00
  • SQL Server中通过reverse取某个最后一次出现的符号后面的内容(字符串反转)

    2012-07-11 15:59:36
  • Python元组定义及集合的使用

    2023-11-22 12:32:03
  • 初学python数组的处理代码

    2023-10-14 19:30:19
  • Python读取stdin方法实例

    2022-09-07 19:03:00
  • Godaddy 导入导出MSSQL数据库的实现步骤

    2024-01-19 15:11:56
  • 二级下拉菜单代码

    2008-11-01 18:18:00
  • Python实现给qq邮箱发送邮件的方法

    2022-11-16 21:01:21
  • Scrapy使用的基本流程与实例讲解

    2022-08-15 17:51:19
  • 在Python中通过机器学习实现人体姿势估计

    2022-05-20 13:08:25
  • 常用的9个JavaScript图表库详解

    2024-04-22 22:34:52
  • 如何利用python turtle绘图自定义画布背景颜色

    2021-08-02 17:28:49
  • jenkins配置python脚本定时任务过程图解

    2023-11-12 12:57:15
  • mysql 5.7.5 m15 winx64安装配置方法图文教程

    2024-01-14 10:35:04
  • python字典的遍历3种方法详解

    2022-05-01 06:00:44
  • jupyter notebook oepncv 显示一张图像的实现

    2022-03-26 20:09:19
  • asp之家 网络编程 m.aspxhome.com