快速解释如何使用pandas的inplace参数的使用

作者:deephub 时间:2021-07-20 16:36:29 

介绍

在操作数据帧时,初学者有时甚至是更高级的数据科学家会对如何在pandas中使用inplace参数感到困惑。

更有趣的是,我看到的解释这个概念的文章或教程并不多。它似乎被假定为知识或自我解释的概念。不幸的是,这对每个人来说都不是那么简单,因此本文试图解释什么是inplace参数以及如何正确使用它。

让我们来看看一些使用inplace的函数的例子:

  • fillna()

  • dropna()

  • sort_values()

  • reset_index()

  • sort_index()

  • rename()

我已经创建了这个列表,可能还有更多的函数使用inplace作为参数。我没有记住所有这些函数,但是作为参数的几乎所有pandas DataFrame函数都将以类似的方式运行。这意味着在处理它们时,您将能够应用本文将介绍的相同逻辑。

创建一个示例DataFrame

为了说明inplace的用法,我们将创建一个示例DataFrame。


import pandas as pd
import numpy as np
client_dictionary = {'name': ['Michael', 'Ana', 'Sean', 'Carl', 'Bob'],
          'second name': [None, 'Angel', 'Ben', 'Frank', 'Daniel'],
          'birth place': ['New York', 'New York', 'Los Angeles', 'New York', 'New York'],
          'age': [10, 35, 56, None, 28],
          'number of children': [0, None, 2, 1, 1]}
df = pd.DataFrame(client_dictionary)
df.head()

快速解释如何使用pandas的inplace参数的使用

我们创建了一个数据框架,该数据框架有5行,列如下: name, second name, birthplace,age,number of children。注意,age、second name和children列中有一些缺失值(nan)。

现在我们将演示dropna()函数如何使用inplace参数工作。因为我们想要检查两个不同的变体,所以我们将创建原始数据框架的两个副本。


df_1 = df.copy()
df_2 = df.copy()

下面的代码将删除所有缺少值的行。


df_1.dropna(inplace=True)

如果您在Jupyter notebook中运行此操作,您将看到单元格没有输出。这是因为inplace=True函数不返回任何内容。它用所需的操作修改现有的数据帧,并在原始数据帧上“就地”(inplace)执行。

如果在数据帧上运行head()函数,应该会看到有两行被删除。


df_1.dropna(inplace=True)

现在我们用inplace = False运行相同的代码。注意,这次我们将使用df_2版本的df


df_2.dropna(inplace=False)

快速解释如何使用pandas的inplace参数的使用

如果您在Jupyter notebook中运行此代码,您将看到有一个输出(上面的屏幕截图)。inplace = False函数将返回包含删除行的数据。

记住,当inplace被设置为True时,不会返回任何东西,但是原始数据被修改了。

那么这一次原始数据会发生什么呢?让我们调用head()函数进行检查。


df_2.head()

快速解释如何使用pandas的inplace参数的使用

原始数据不变!那么发生了什么?

当您使用inplace=True时,将创建并更改新对象,而不是原始数据。如果您希望更新原始数据以反映已删除的行,则必须将结果重新分配到原始数据中,如下面的代码所示。


df_2 = df_2.dropna(inplace=False)

这正是我们在使用inplace=True时所做的。是的,最后一行代码等价于下面一行:


df_2.dropna(inplace=True)

后者更优雅,并且不创建中间对象,然后将其重新分配给原始变量。它直接改变原始数据框架,因此,如果需要改变原始数据,那么inplace=True是首选。

那么,为什么会有在使用inplace=True产生错误呢?我不太确定,可能是因为有些人还不知道如何正确使用这个参数。让我们看看一些常见的错误。

常见错误

使用inplace = True处理一个片段

如果我们只是想去掉第二个name和age列中的NaN,而保留number of children列不变,我们该怎么办?

我见过有人这样做:


df[['second name', 'age']].dropna(inplace=True)

这会抛出以下警告。

快速解释如何使用pandas的inplace参数的使用

这个警告之所以出现是因为Pandas设计师很好,他们实际上是在警告你不要做你可能不想做的事情。该代码正在更改只有两列的dataframe,而不是原始数据框架。这样做的原因是,您选择了dataframe的一个片段,并将dropna()应用到这个片段,而不是原始dataframe。

为了纠正它,可以这样使用


df.dropna(inplace=True, subset=['second name', 'age'])
df.head()

快速解释如何使用pandas的inplace参数的使用

这将导致从dataframe中删除第二个name和age列中值为空的行。

将变量值赋给inplace= True的结果


df = df.dropna(inplace=True)

这又是你永远不应该做的事情!你只需要将None重新赋值给df。记住,当你使用inplace=True时,什么也不会返回。因此,这段代码的结果是将把None分配给df。

总结

我希望本文为您揭开inplace参数的神秘面纱,您将能够在您的代码中正确地使用它。

来源:https://blog.csdn.net/m0_46510245/article/details/107480410

标签:pandas,inplace,参数
0
投稿

猜你喜欢

  • php购物车实现方法

    2023-11-16 22:54:51
  • 一文详解Go中方法接收器的选择

    2024-05-28 15:36:32
  • 使用Python编写一个最基础的代码解释器的要点解析

    2023-07-16 11:47:22
  • MySQL批量SQL插入性能优化详解

    2024-01-21 15:25:59
  • Python群发邮件实例代码

    2021-05-05 18:42:35
  • 浅谈js的html元素的父节点,子节点

    2024-04-23 09:31:56
  • 关于Python 实现tuple和list的转换问题

    2022-02-18 21:29:03
  • 如何决定是否将登录内容保存到Cookie里?

    2009-12-16 18:54:00
  • Python实现简单的获取图片爬虫功能示例

    2023-01-31 06:15:13
  • Python代码实现http/https代理服务器的脚本

    2022-04-12 10:19:06
  • 解决SQL Server日志文件损坏严重的问题

    2009-02-05 15:55:00
  • Python开发毕设案例之桌面学生信息管理程序

    2021-03-02 14:56:08
  • Oracle数据库及应用程序优化开发者网络Oracle

    2010-07-18 13:02:00
  • Python单元测试的9个技巧技巧

    2023-03-22 09:58:57
  • 前端开发中的一些用户体验细节

    2010-10-19 12:23:00
  • 模拟下拉菜单[兼容IE系列以及火狐]

    2009-12-13 10:23:00
  • 一个入门级python爬虫教程详解

    2023-03-27 17:34:08
  • Python退出时强制运行一段代码的实现方法

    2021-02-07 08:04:16
  • 使用python远程操作linux过程解析

    2021-12-01 21:05:27
  • Python内置数据结构与操作符的练习题集锦

    2022-07-25 05:12:53
  • asp之家 网络编程 m.aspxhome.com