Python使用pandas导入xlsx格式的excel文件内容操作代码

作者:smart_cat 时间:2022-03-12 04:29:57 

Python使用pandas导入xlsx格式的excel文件内容

1. 基本导入

在 Python中使用pandas导入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择在路径前面加r

2. 列标题与数据对齐

因为我们的表格中有中文,中文占用的字符和英文、数字占用的字符不一样,因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的,Jupyter 会自动渲染出一个表格,则无需这个设置。

import pandas as pd
#处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.ambiguous_as_wide', True)
#无法对齐主要是因为列标题是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

Python使用pandas导入xlsx格式的excel文件内容操作代码

3. 指定导入某个sheet

通过sheet_name参数可以指定要导入哪个sheet的内容。注意这里的名字是区分大小写的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具体的sheet名字,还可以传入sheet的index下标,从0开始计数。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name参数,那么默认导入的都是第一个sheet的内容。

4. 指定行索引

在本地文件导入DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

5. 指定列索引

将本地文件导入DataFrame时,默认使用源数据表的第一行作为列索引,也可以通过设置header参数来设置列索引。 header参数值默认为0,即用第一行作为列索引;也可以是其他行,只需要传入具体的那一行即可;也可以使用默认从0开始的数作为列索引。

使用默认从0开始的数作为列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

6. 指定导入列

有的时候本地文件的列数太多,而我们又不需要那么多列时,我们就可以通过设定usecols参数来指定要导入的列。

Python使用pandas导入xlsx格式的excel文件内容操作代码

从参数的形式来看,可以通过以下几种形式来指定:

  • 通过列表指定,列表中是列的下标,从0开始计数。

  • 通过列表指定,列表中是列的名字

  • 通过元组指定, 元组中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性别'])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年龄'))
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

7. 指定导入的行数

如果文件很大,我们不想导入全部的行,只需要导入前面若干行进行分析即可,那么可以通过nrows参数来指定导入多少行数据

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

8. 更多的参数

请参考pandas官方文档。

来源:https://blog.csdn.net/hubing_hust/article/details/128412197

标签:Python,xlsx格式,excel文件
0
投稿

猜你喜欢

  • 向上不间断(无缝)滚动图片js代码

    2007-09-24 20:22:00
  • 在SQL触发器或存储过程中获取在程序登录的用户

    2012-01-29 18:01:32
  • SQL 统计一个数据库中所有表记录的数量

    2012-01-29 18:21:36
  • 快速解决SQL server 2005孤立用户问题

    2009-01-04 14:02:00
  • SQL Server 2005 SSIS技巧:动态目的文件名

    2008-12-05 15:47:00
  • PHP+JS实现文件分块上传的示例代码

    2023-06-12 00:04:07
  • Python实现基于POS算法的区块链

    2023-10-30 01:47:19
  • 页面表达常用方式

    2010-05-27 12:42:00
  • html网页颜色表大全(苏昱)

    2008-01-01 15:52:00
  • 详解AJAX核心 —— XMLHttpRequest 对象

    2010-03-31 14:49:00
  • CSS Type set: 在线字体调整工具

    2008-03-02 15:36:00
  • Javascript与PHP验证用户输入URL地址是否正确

    2023-10-23 02:36:07
  • javascript开发经验谈

    2009-05-01 12:14:00
  • 几个javascript特效代码

    2010-04-23 20:39:00
  • python基于paramiko库远程执行 SSH 命令,实现 sftp 下载文件

    2022-11-09 23:31:31
  • php绘制圆形的方法

    2023-10-29 17:31:52
  • Dreamweaver行为体验

    2007-02-03 11:39:00
  • pjblog3相关日志功能(支持生成静态模式)

    2008-11-20 13:41:00
  • 大写锁定提醒

    2009-06-11 13:12:00
  • HTML 标签是否匹配检测代码

    2010-03-17 20:50:00
  • asp之家 网络编程 m.aspxhome.com