教你漂亮打印Pandas DataFrames和Series

作者:deephub 时间:2022-11-10 19:08:56 

一、前言

当我们必须处理可能有多个列和行的大型DataFrames时,能够以可读格式显示数据是很重要的。这在调试代码时非常有用。

默认情况下,当打印出DataFrame且具有相当多的列时,仅列的子集显示到标准输出。 显示的列甚至可以多行打印出来。

二、问题

假设我们有以下DataFrame:


import pandas as pd
import numpy as np

df = pd.DataFrame(
 np.random.randint(0, 100, size=(100, 25)),
 columns=[f'column{i}' for i in range(0, 25)]
)

print(df)

现在,如果列数超过显示选项display.max_rows的值,则输出DataFrame可能不完整,如下所示。 仅显示一部分列(缺少第4列和第5列),而其余列以多行方式打印。

教你漂亮打印Pandas DataFrames和Series

尽管输出仍可读取,但绝对不建议保留列或将其打印在多行中。

三、如何漂亮打印Pandas的DataFrames

如果您的显示器足够宽并且能够容纳更多列,则可能需要调整一些显示选项。 我将在下面使用的值可能不适用于您的设置,因此请确保对其进行相应的调整。 就个人而言,我使用超宽显示器,可以在必要时打印出相当多的列。

如何在同一行打印所有列

现在,为了显示所有的列(如果你的显示器能够适合他们),并在短短一行所有你需要做的是设置显示选项expand_frame_repr为False:


pd.set_option('expand_frame_repr', False)

教你漂亮打印Pandas DataFrames和Series

display.expand_frame_repr 默认值:True

是否跨多行打印宽数据的完整DataFrame ,可以考虑使用max_columns,但是如果宽度超过display.width,则输出将在多个“页面”中回绕。

另外,您可以更改display.max_rows的值,而不是将expand_frame_repr设置为False:


pd.set_option(‘display.max_rows', False)

如果列仍打印在多页中,那么您可能还必须调整display.width。

四、如何打印所有行

现在,如果您的DataFrame包含的行数超过一定数目,那么将仅显示一些记录(来自df的头部和尾部):


import pandas as pd
import numpy as np

df = pd.DataFrame(
 np.random.randint(0, 5, size=(100, 4)),
 columns=[f'column{i}' for i in range(0, 4)]
)

print(df)

# column0  column1  column2  column3
# 0         4        0        0        0
# 1         2        2        4        2
# 2         2        4        0        2
# 3         0        0        0        4
# 4         3        4        3        3
# ..      ...      ...      ...      ...
# 95        3        1        1        2
# 96        1        4        0        0
# 97        0        3        2        1
# 98        3        3        4        2
# 99        0        3        0        3
# [100 rows x 4 columns]

如果要显示更大范围(甚至全部)的行,则需要将display.max_rows设置为要输出的行数。 如果要显示所有行,请将其设置为“None”:


pd.set_option('display.max_rows', None)

五、使用上下文管理器

更好的方法是使用option_context(),它是一个上下文管理器,可用于在with语句上下文中临时设置特定选项。


import pandas as pd
import numpy as np

df = pd.DataFrame(
 np.random.randint(0, 100, size=(100, 25)),
 columns=[f'column{i}' for i in range(0, 25)]
)

with pd.option_context('expand_frame_repr', False, 'display.max_rows', None):
 print(df)

六、其他有用的显示选项

您可以调整更多显示选项,并更改Pandas DataFrames的显示方式。

display.max_colwidth:这是显示列名的最大字符数。 如果某个列名溢出,则将添加一个占位符(…)。


pd.set_option('display.max_colwidth', None)

display.precision:这是将用于浮点数的精度。 它指定小数点后的位数。

display.width:这是显示字符的总数。 如果要显示更多列,则可能有时还必须调整display.width。

您可以使用describe_option()找到完整的显示列表:


pd.describe_option(‘display') .

给Jupyter用户的注意事项

如果您正在使用Jupyter Notebooks,而不是print(df),只需使用display(df)即可相应地调整宽度。

七、总结

在今天的文章中,我们讨论了Pandas的一些显示选项,使您可以根据要显示的内容以及可能使用的显示器,漂亮地打印DataFrame。

熊猫带有一个设置系统,使用户可以调整和自定义显示功能。 我们仅涵盖了可用显示选项的一小部分。

来源:https://blog.csdn.net/deephub/article/details/117250536

标签:打印,Pandas,DataFrames,Series
0
投稿

猜你喜欢

  • Varchar与char的区别

    2008-02-28 12:44:00
  • 为什么相对PHP黑python的更少

    2024-05-21 10:20:51
  • MySql中特殊运算符的使用方法总结

    2024-01-19 23:27:09
  • Django框架模板介绍

    2021-07-05 07:34:18
  • Python 使用input同时输入多个数的操作

    2023-09-23 22:36:42
  • 轻松解决:mysql数据库连接过多的错误

    2010-09-30 14:28:00
  • python 遍历字符串(含汉字)实例详解

    2022-10-06 05:08:58
  • python通过安装itchat包实现微信自动回复收到的春节祝福

    2022-07-09 20:36:26
  • 关于设计的一些个人看法

    2008-06-12 12:44:00
  • Python语法概念基础详解

    2023-07-07 01:36:24
  • vue函数防抖与节流的正确使用方法

    2024-05-29 22:43:01
  • 如何在Frontpage中定义CSS样式

    2008-08-02 12:32:00
  • Python 如何实时向文件写入数据(附代码)

    2022-11-10 13:40:03
  • 详解django中url路由配置及渲染方式

    2021-04-29 01:28:50
  • 浅谈JS原生Ajax,GET和POST

    2024-04-16 08:52:41
  • pytorch训练时的显存占用递增的问题解决

    2021-04-20 07:12:45
  • js执行shell命令的几种方式(Node)

    2024-04-16 10:35:14
  • Go语言在Linux环境下输出彩色字符的方法

    2024-01-30 12:02:36
  • Python使用matplotlib绘图无法显示中文问题的解决方法

    2023-07-30 22:16:30
  • python 反编译exe文件为py文件的实例代码

    2021-12-06 06:51:21
  • asp之家 网络编程 m.aspxhome.com