Pandas 同元素多列去重的实例

作者:迪小子 时间:2023-02-09 21:03:32 

有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现。

首先我们看一下数据类型:


G1 G2
a b
b a
c d
d c
e f

对这样的两列数据进行同元素去重,最终得到结果为:


G1 G2
a b
c d
e f

代码如下:


#-*- coding: utf-8 -*-
data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}
data = pd.DataFrame(data)
data['G3'] = data['G1'] + '|' + data['G2']
p = []
for i in data['G3'].tolist():
 tmp = sorted(i.split('|')) # The most important part,sort
 p.append(tmp[0] + '|' + tmp[1])
data['G3'] = pd.Series(p)
data = data.drop_duplicates('G3')

来源:https://blog.csdn.net/u011476718/article/details/62416776

标签:Pandas,多列,去重
0
投稿

猜你喜欢

  • Python排序搜索基本算法之选择排序实例分析

    2023-10-05 20:01:12
  • tensorflow-gpu安装的常见问题及解决方案

    2021-08-18 11:31:18
  • MySQL单表ibd文件恢复方法详解

    2024-01-15 19:39:21
  • golang 网络框架之gin的使用方法

    2023-07-19 02:35:37
  • Python蛇形方阵的实现

    2023-06-27 16:33:21
  • 利用SQL语言有没有办法查到表中哪些记录中的全部

    2009-04-10 18:29:00
  • python中实现延时回调普通函数示例代码

    2023-10-03 02:17:04
  • Python发送邮件的实例代码讲解

    2021-06-05 02:35:10
  • Python中创建二维数组

    2023-11-24 15:14:54
  • python中not not x 与bool(x) 的区别

    2021-04-27 03:50:17
  • ASP如何获取通过代理的真实IP地址

    2007-09-20 13:11:00
  • Python机器学习logistic回归代码解析

    2021-02-20 23:59:16
  • Python Excel数据处理之xlrd/xlwt/xlutils模块详解

    2022-03-28 16:45:53
  • python使用socket实现图像传输功能

    2023-08-30 17:10:17
  • python 离散点图画法的实现

    2021-04-14 17:00:31
  • php控制文件下载速度的方法

    2023-07-19 00:21:30
  • MySQL 常用引擎总结分享

    2024-01-27 04:05:28
  • Django实现发送邮件功能

    2021-05-13 10:25:44
  • Laravel中数据库迁移操作的示例详解

    2023-05-25 06:27:38
  • php多进程中的阻塞与非阻塞操作实例分析

    2023-11-14 23:43:44
  • asp之家 网络编程 m.aspxhome.com