Python Pandas读取Excel日期数据的异常处理方法

作者:小小明-代码实体 时间:2021-12-10 11:22:55 

异常描述

有时我们的Excel有一个调整过自定义格式的日期字段:

Python Pandas读取Excel日期数据的异常处理方法

当我们用pandas读取时却是这样的效果:

Python Pandas读取Excel日期数据的异常处理方法

不管如何指定参数都无效。

出现原因

没有使用系统内置的日期单元格格式,自定义格式没有对负数格式进行定义,pandas读取时无法识别出是日期格式,而是读取出单元格实际存储的数值。

Python Pandas读取Excel日期数据的异常处理方法

解决方案:修改自定义格式

可以修改为系统内置的自定义格式:

Python Pandas读取Excel日期数据的异常处理方法

或者在自定义格式上补充负数的定义:

Python Pandas读取Excel日期数据的异常处理方法

增加;@即可

pandas直接解析Excel数值为日期

有时这种Excel很多,我们需要通过pandas批量读取,挨个人工修改Excel的自定义格式费时费力,下面我演示如何使用pandas直接解析这些数值成为日期格式。

excel中常规格式和日期格式的转换规则如下:

1900/1/1为起始日期,转换的数字是1,往后的每一天增加1

1900/1/2转换为数字是 2

1900/1/3转换为数字是 3

1900/1/4转换为数字是 4

以此类推

excel中时间转换规则如下:

在时间中的规则是把1天转换为数字是 1

每1小时就是 1/24

每1分钟就是 1/(24×60)=1/1440

每1秒钟就是 1/(24×60×60)=1/86400

根据Excel的日期存储规则,我们只需要以1900/1/1为基准日期,根据数值n偏移n-1天即可得到实际日期。不过还有个问题,Excel多存储了1900年2月29日这一天,而正常的日历是没有这一天的,而我们的日期又都是大于1900年的,所以应该偏移n-2天,干脆使用1899年12月30日作为基准,这样不需要作减法操作。

解析代码如下:

import pandas as pd
from pandas.tseries.offsets import Day

df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.apply(lambda x: f"{x.month}月{x.day}日")
df.head()
 日期
06月8日
16月9日
26月10日
36月11日
46月12日

如果需要调用time的strftime方法,由于包含中文则需要设置locale:

import pandas as pd
from pandas.tseries.offsets import Day
import locale
locale.setlocale(locale.LC_CTYPE, 'chinese')

df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.dt.strftime('%Y年%m月%d日')
df.head()
 日期
02021年06月08日
12021年06月09日
22021年06月10日
32021年06月11日
42021年06月12日

总结 

来源:https://blog.csdn.net/as604049322/article/details/117919953

标签:pandas,excel,日期
0
投稿

猜你喜欢

  • Python自定义模块的创建与使用

    2021-01-05 20:47:14
  • Python根据文件名批量转移图片的方法

    2023-03-14 15:00:21
  • 如何设置PyCharm中的Python代码模版(推荐)

    2022-12-14 03:56:29
  • python实现数字炸弹游戏程序

    2021-09-29 18:44:24
  • zabbix进行数据库备份以及表分区的方法

    2024-01-16 13:01:46
  • 浅析BootStrap模态框的使用(经典)

    2023-08-20 02:21:19
  • 分享8点超级有用的Python编程建议(推荐)

    2022-03-31 08:05:57
  • Python 的矩阵传播机制Broadcasting和矩阵运算

    2021-07-28 01:03:34
  • pytorch forward两个参数实例

    2022-09-05 09:54:34
  • Python paramiko模块使用解析(实现ssh)

    2021-02-03 10:29:26
  • Python中使用json.load()和json.loads()加载json数据的方法实例

    2021-12-15 20:12:31
  • 详解vuejs之v-for列表渲染

    2023-07-02 16:56:39
  • Python 通过爬虫实现GitHub网页的模拟登录的示例代码

    2022-04-27 00:26:39
  • Vue.js 中取得后台原生HTML字符串 原样显示问题的解决方法

    2024-04-30 10:21:38
  • asp函数判断服务器是否安装了某种组件

    2008-10-11 14:45:00
  • Python接口自动化浅析logging封装及实战操作

    2022-12-04 12:21:44
  • python输出电脑上所有的串口名的方法

    2022-06-23 20:56:03
  • vue实现触底查询功能

    2024-04-30 10:25:01
  • Python数学建模PuLP库线性规划入门示例详解

    2023-06-13 13:06:20
  • asp代码WinHttp.WinHttpRequest.5.1使用例子

    2010-03-11 21:28:00
  • asp之家 网络编程 m.aspxhome.com