使用pd.merge表连接出现多余行的问题解决

作者:路明非Re 时间:2023-08-25 11:34:24 

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
   how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
keep='first',inplace=True)

这样结果就没有问题了。

来源:https://blog.csdn.net/yefan_001/article/details/124611893

标签:pd.merge,表连接
0
投稿

猜你喜欢

  • 如何解决springboot数据库查询时出现的时区差异问题

    2024-01-26 01:53:01
  • python 使用paramiko模块进行封装,远程操作linux主机的示例代码

    2023-03-08 19:38:19
  • 如何把图片上传到数据库中并显示出来?

    2009-11-06 13:50:00
  • 浅谈javascript中的DOM方法

    2024-04-29 13:44:12
  • 对python3标准库httpclient的使用详解

    2021-09-07 06:48:02
  • sqlserver 脚本和批处理指令小结

    2024-01-20 06:41:37
  • tf.truncated_normal与tf.random_normal的详细用法

    2023-03-02 01:15:08
  • 什么是python的必选参数

    2022-12-04 07:28:36
  • Go语言参数传递是传值还是传引用

    2024-02-20 02:32:34
  • tf.concat中axis的含义与使用详解

    2021-05-21 12:38:00
  • golang beego框架路由ORM增删改查完整案例

    2024-05-09 15:00:59
  • 一文详解Python中多进程和进程池的使用方法

    2023-12-01 04:10:12
  • PHP遍历目录实现方法介绍

    2023-05-25 06:31:41
  • TensorFlow实现Logistic回归

    2023-11-27 18:49:14
  • Keras搭建M2Det目标检测平台示例

    2023-11-10 10:49:01
  • python魔法方法-自定义序列详解

    2022-10-08 08:56:12
  • 用 Python 脚本实现电脑唤醒后自动拍照并截屏发邮件通知

    2023-08-30 14:15:44
  • 多表关联同时更新多条不同的记录方法分享

    2011-11-03 17:34:25
  • 简单介绍Python中的round()方法

    2023-05-01 11:57:10
  • 超级简单实现框架滚动控制

    2008-07-01 12:14:00
  • asp之家 网络编程 m.aspxhome.com