Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

作者:Asher117 时间:2023-09-29 20:42:35 

摘要

在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值。
这里就简单的介绍一下对于DataFrame去重和取重复值的操作。

创建DataFrame

这里首先创建一个包含一行重复值的DataFrame。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

2.DataFrame去重,可以选择是否保留重复值,默认是保留重复值,想要不保留重复值的话直接设置参数keep为False即可。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

3.取DataFrame重复值。大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我们就可以根据刚刚上面我们得到的两个DataFrame来concat到一起之后去重不保留重复值就可以。这样就把重复值取出来了。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

###############################
分割线:补充
###############################

4.DataFrame根据某列去重

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

5.DataFrame根据某几列去重

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

来源:https://blog.csdn.net/Asher117/article/details/84454969

标签:DataFrame,drop,duplicates,去重
0
投稿

猜你喜欢

  • 在centos7中分布式部署pyspider

    2022-10-28 15:53:00
  • django drf框架中的user验证以及JWT拓展的介绍

    2023-12-31 21:14:11
  • Python中py文件转换成exe可执行文件的方法

    2022-09-30 02:01:40
  • 出现“不能执行已释放的Script代码”错误的原因及解决办法

    2024-04-19 10:02:13
  • 在Python中操作字符串之rstrip()方法的使用

    2022-03-22 18:34:36
  • Python绑定方法与非绑定方法详解

    2021-04-12 00:20:19
  • Python统计学一数据的概括性度量详解

    2022-08-16 03:18:20
  • numpy.sum()坐标轴问题的解决

    2023-08-23 15:05:53
  • PHP生成sitemap.xml地图函数

    2024-06-05 09:23:16
  • 原生JS中应该禁止出现的写法

    2024-04-10 11:00:49
  • PyQt 线程类 QThread使用详解

    2021-09-18 05:51:37
  • mysql定时任务(event事件)实现详解

    2024-01-25 13:22:18
  • CSS清除浮动常用方法小结

    2009-07-07 11:59:00
  • python 密码验证(滑块验证)

    2021-01-24 02:32:18
  • python typing模块--类型提示支持

    2023-11-11 16:47:27
  • WINDOWS下安装MYSQL教程详解

    2024-01-22 17:20:34
  • vue eslint报错error "Component name "*****" should always be multi-word"解决

    2024-05-13 09:10:32
  • python中matplotlib实现最小二乘法拟合的过程详解

    2022-03-07 05:17:51
  • 深入浅析python3 依赖倒置原则(示例代码)

    2021-07-30 02:27:33
  • Python实现Sqlite将字段当做索引进行查询的方法

    2021-06-05 13:31:51
  • asp之家 网络编程 m.aspxhome.com