Pandas 连接合并函数merge()详解

作者:ckSpark 时间:2021-10-28 05:13:44 

一、merge函数用途

pandas中的merge()函数类似于SQL中join的用法,可以将不同数据集依照某些字段(属性)进行合并操作,得到一个新的数据集。

二、merge()函数的具体参数

用法:


DataFrame1.merge(DataFrame2, how=‘inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', ‘_y'))

参数说明

参数说明
how默认为inner,可设为inner/outer/left/right
on根据某个字段进行连接,必须存在于两个DateFrame中(若未同时存在,则需要分别使用left_on和right_on来设置)
left_on左连接,以DataFrame1中用作连接键的列
right_on右连接,以DataFrame2中用作连接键的列
left_index将DataFrame1行索引用作连接键
right_index将DataFrame2行索引用作连接键
sort根据连接键对合并后的数据进行排列,默认为True
suffixes对两个数据集中出现的重复列,新数据集中加上后缀_x,_y进行区别

三、merge用法举例

创建两个数据框


#利用字典dict创建数据框
dataDf1=pd.DataFrame({'lkey':['foo','bar','baz','foo'],
     'value':[1,2,3,4]})
dataDf2=pd.DataFrame({'rkey':['foo','bar','qux','bar'],
     'value':[5,6,7,8]})
print(dataDf1)
print(dataDf2)
>>>
lkey value
0 foo  1
1 bar  2
2 baz  3
3 foo  4

rkey value
0 foo  5
1 bar  6
2 qux  7
3 bar  8

内连接(Inner)


#inner链接
dataLfDf=dataDf1.merge(dataDf2, left_on='lkey',right_on='rkey')
>>>
lkey value_x rkey value_y
0 foo  1 foo  5
1 foo  4 foo  5
2 bar  2 bar  6
3 bar  2 bar  8

右链接(Right)


#Right链接
dataDf1.merge(dataDf2, left_on='lkey', right_on='rkey',how='right')
>>>
lkey value_x rkey value_y
0 foo  1.0 foo  5
1 foo  4.0 foo  5
2 bar  2.0 bar  6
3 bar  2.0 bar  8
4 NaN  NaN qux  7

全链接(Outer)


#Outer链接
dataDf1.merge(dataDf2, left_on='lkey', right_on='rkey', how='outer')
>>>
lkey value_x rkey value_y
0 foo  1.0 foo  5.0
1 foo  4.0 foo  5.0
2 bar  2.0 bar  6.0
3 bar  2.0 bar  8.0
4 baz  3.0 NaN  NaN
5 NaN  NaN qux  7.0

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

来源:https://blog.csdn.net/MsSpark/article/details/83098468

标签:Pandas,合并,merge
0
投稿

猜你喜欢

  • python 实现 hive中类似 lateral view explode的功能示例

    2021-08-20 13:51:45
  • Pandas 同元素多列去重的实例

    2023-02-09 21:03:32
  • python如何正确的操作字符串

    2023-12-28 02:46:30
  • Golang中异常处理机制详解

    2024-02-17 17:05:50
  • Python字符串格式化的方法(两种)

    2023-08-28 17:13:10
  • Python实现翻转数组功能示例

    2022-02-28 09:03:09
  • 详解Python编程中time模块的使用

    2023-08-29 16:57:08
  • PyCharm 2020.2.2 x64 下载并安装的详细教程

    2023-11-29 13:36:32
  • Django框架表单操作实例分析

    2022-01-27 23:43:59
  • SQL Server错误代码大全及解释(留着备用)

    2012-07-11 16:17:03
  • Python中import语句用法案例讲解

    2023-08-07 05:33:47
  • 使用TensorFlow搭建一个全连接神经网络教程

    2023-01-10 10:59:20
  • Jquery实现div模拟Select控件

    2008-12-01 15:47:00
  • Go语言操作MySQL的知识总结

    2024-01-26 01:43:17
  • mysql登录遇到ERROR 1045问题解决方法

    2024-01-22 15:09:57
  • Python模块学习 filecmp 文件比较

    2023-07-09 18:30:44
  • Python爬虫获取基金变动信息

    2022-08-15 21:57:15
  • 用Python画圣诞树代码示例

    2023-06-14 06:22:27
  • MySQL的之表结构修改

    2012-01-05 19:16:17
  • 如果没设置 DSN 也能建立数据库连接吗?

    2009-11-02 20:16:00
  • asp之家 网络编程 m.aspxhome.com