Pandas 同元素多列去重的实例
作者:迪小子 时间:2023-02-09 21:03:32
有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现。
首先我们看一下数据类型:
G1 G2
a b
b a
c d
d c
e f
对这样的两列数据进行同元素去重,最终得到结果为:
G1 G2
a b
c d
e f
代码如下:
#-*- coding: utf-8 -*-
data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}
data = pd.DataFrame(data)
data['G3'] = data['G1'] + '|' + data['G2']
p = []
for i in data['G3'].tolist():
tmp = sorted(i.split('|')) # The most important part,sort
p.append(tmp[0] + '|' + tmp[1])
data['G3'] = pd.Series(p)
data = data.drop_duplicates('G3')
来源:https://blog.csdn.net/u011476718/article/details/62416776
标签:Pandas,多列,去重


猜你喜欢
Python排序搜索基本算法之选择排序实例分析
2023-10-05 20:01:12

tensorflow-gpu安装的常见问题及解决方案
2021-08-18 11:31:18

MySQL单表ibd文件恢复方法详解
2024-01-15 19:39:21
golang 网络框架之gin的使用方法
2023-07-19 02:35:37
Python蛇形方阵的实现
2023-06-27 16:33:21
利用SQL语言有没有办法查到表中哪些记录中的全部
2009-04-10 18:29:00
python中实现延时回调普通函数示例代码
2023-10-03 02:17:04
Python发送邮件的实例代码讲解
2021-06-05 02:35:10
Python中创建二维数组
2023-11-24 15:14:54

python中not not x 与bool(x) 的区别
2021-04-27 03:50:17

ASP如何获取通过代理的真实IP地址
2007-09-20 13:11:00
Python机器学习logistic回归代码解析
2021-02-20 23:59:16

Python Excel数据处理之xlrd/xlwt/xlutils模块详解
2022-03-28 16:45:53

python使用socket实现图像传输功能
2023-08-30 17:10:17
python 离散点图画法的实现
2021-04-14 17:00:31

php控制文件下载速度的方法
2023-07-19 00:21:30
MySQL 常用引擎总结分享
2024-01-27 04:05:28

Django实现发送邮件功能
2021-05-13 10:25:44

Laravel中数据库迁移操作的示例详解
2023-05-25 06:27:38
php多进程中的阻塞与非阻塞操作实例分析
2023-11-14 23:43:44