使用pd.merge表连接出现多余行的问题解决
作者:路明非Re 时间:2023-08-25 11:34:24
本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。
利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。
paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
how='left',left_on='出版物',right_on='名称',sort=False)
结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:
出版物 名称 指标
出版物A 出版物A 指标1
出版物A 出版物A 指标2 #多余的行
这里选择预先删除 表2出版物指标 中的重复出版物信息。
publicationIndicator.drop_duplicates(subset=['名称'],
keep='first',inplace=True)
这样结果就没有问题了。
来源:https://blog.csdn.net/yefan_001/article/details/124611893
标签:pd.merge,表连接
0
投稿
猜你喜欢
如何解决springboot数据库查询时出现的时区差异问题
2024-01-26 01:53:01
python 使用paramiko模块进行封装,远程操作linux主机的示例代码
2023-03-08 19:38:19
如何把图片上传到数据库中并显示出来?
2009-11-06 13:50:00
浅谈javascript中的DOM方法
2024-04-29 13:44:12
对python3标准库httpclient的使用详解
2021-09-07 06:48:02
sqlserver 脚本和批处理指令小结
2024-01-20 06:41:37
tf.truncated_normal与tf.random_normal的详细用法
2023-03-02 01:15:08
什么是python的必选参数
2022-12-04 07:28:36
Go语言参数传递是传值还是传引用
2024-02-20 02:32:34
tf.concat中axis的含义与使用详解
2021-05-21 12:38:00
golang beego框架路由ORM增删改查完整案例
2024-05-09 15:00:59
一文详解Python中多进程和进程池的使用方法
2023-12-01 04:10:12
PHP遍历目录实现方法介绍
2023-05-25 06:31:41
TensorFlow实现Logistic回归
2023-11-27 18:49:14
Keras搭建M2Det目标检测平台示例
2023-11-10 10:49:01
python魔法方法-自定义序列详解
2022-10-08 08:56:12
用 Python 脚本实现电脑唤醒后自动拍照并截屏发邮件通知
2023-08-30 14:15:44
多表关联同时更新多条不同的记录方法分享
2011-11-03 17:34:25
简单介绍Python中的round()方法
2023-05-01 11:57:10
超级简单实现框架滚动控制
2008-07-01 12:14:00