对pandas的算术运算和数据对齐实例详解

作者:修炼之路 时间:2023-05-29 07:24:51 

pandas可以对不同索引的对象进行算术运算,如果存在不同的索引对,结果的索引就是该索引对的并集。

一、算术运算

a、series的加法运算


 s1 = Series([1,2,3],index=["a","b","c"])
 s2 = Series([4,5,6],index=["a","c","e"])
 print(s1+s2)
 '''
 a  5.0
 b  NaN
 c  8.0
 e  NaN
 '''

sereis相加会自动进行数据对齐操作,在不重叠的索引处会使用NA(NaN)值进行填充,series进行算术运算的时候,不需要保证series的大小一致。

b、DataFrame的加法运算



d1 = np.arange(1,10).reshape(3,3)
 dataFrame1 = DataFrame(d1,index=["a","b","c"],columns=["one","two","three"])
 d2 = np.arange(1,10).reshape(3,3)
 dataFrame2 = DataFrame(d2,index=["a","b","e"],columns=["one","two","four"])
 print(dataFrame1+dataFrame2)
 '''
   four one three  two
 a  NaN 2.0  NaN  4.0
 b  NaN 8.0  NaN 10.0
 c  NaN NaN  NaN  NaN
 e  NaN NaN  NaN  NaN
 '''

dataFrame相加时,对齐操作需要行和列的索引都重叠的时候才回相加,否则会使用NA值进行填充。

二、指定填充值


 s1 = Series([1,2,3],index=["a","b","c"])
 s2 = Series([4,5,6],index=["a","c","e"])
 print( s1.add(s2,fill_value=0))
 '''
 a  5.0
 b  2.0
 c  8.0
 e  6.0
 '''

需要注意的时候,使用add方法对两个series进行相加的时候,设置fill_value的值是对于不存在索引的series用指定值进行填充后再进行相加。除了加法add,还有sub减法,div除法,mul乘法,使用方式与add相同。DataFrame与series一样。


 s1 = Series([1,2,3],index=["a","b","c"])
 s2 = Series([4,5,6],index=["a","c","e"])
 print(s2.reindex(["a","b","c","d"],fill_value=0))
 '''
 a  4
 b  0
 c  5
 d  0
 '''
 s3 = s1 + s2
 print(s3.reindex(["a","b","c","e"],fill_value=0))
 '''
 a  5.0
 b  NaN
 c  8.0
 e  NaN
 '''

使用reindex进行填充的时候,需要注意的是,不能对已经是值为NaN的进行重新赋值,只能对使用reindex之前不存在的所以使用指定的填充值,DataFrame也是一样的。

三、DataFrame与Series的混合运算

a、DataFrame的行进行广播


 a = np.arange(9).reshape(3,3)
 d = DataFrame(a,index=["a","b","c"],columns=["one","two","three"])
 #取d的第一行为Series
 s = d.ix[0]
 print(d+s)
 '''
   one two three
 a  0  2   4
 b  3  5   7
 c  6  8   10
 '''

b、DataFrame的列进行广播


 a = np.arange(9).reshape(3,3)
 d = DataFrame(a,index=["a","b","c"],columns=["one","two","three"])
 #取d的第一列为Series
 s = d["one"]
 print(d.add(s,axis=0))
 '''
   one two three
 a  0  1   2
 b  6  7   8
 c  12  13   14
 '''

对列进行广播的时候,必须要使用add方法,而且还要将axis设置为0,不然就会得到下面的结果


 print(d.add(s))
 '''
   a  b  c one three two
 a NaN NaN NaN NaN  NaN NaN
 b NaN NaN NaN NaN  NaN NaN
 c NaN NaN NaN NaN  NaN NaN
 '''

来源:https://blog.csdn.net/sinat_29957455/article/details/78989104

标签:pandas,算术,运算
0
投稿

猜你喜欢

  • python列表中remove()函数的使用方法详解

    2021-05-13 22:52:46
  • 剖析网页设计中的几何圆

    2010-10-19 12:27:00
  • MySQL索引类型一览 让MySQL高效运行起来

    2010-04-22 16:52:00
  • ASP中实现分页显示的七种方法

    2007-09-20 13:19:00
  • 网页布局设计基础

    2008-10-16 13:58:00
  • Python中使用haystack实现django全文检索搜索引擎功能

    2023-06-30 07:21:03
  • asp 类型转换函数大全第1/2页

    2011-04-07 11:06:00
  • python2.7的flask框架之引用js&css等静态文件的实现方法

    2022-05-04 12:09:27
  • 详解Python用户登录接口的方法

    2021-10-09 23:26:48
  • Python动态演示旋转矩阵的作用详解

    2022-08-21 02:35:15
  • PyTorch 之 强大的 hub 模块和搭建神经网络进行气温预测

    2022-11-11 14:41:15
  • 让你知道codepage的重要,关于多语言编码

    2008-01-31 12:04:00
  • linecache模块加载和缓存文件内容详解

    2022-09-23 20:00:45
  • 支付宝lab logo设计创意发想

    2009-11-12 12:44:00
  • Python查看Tensor尺寸及查看数据类型的实现

    2023-06-06 15:24:54
  • webpack学习教程之publicPath路径问题详解

    2023-07-16 06:09:52
  • python 将md5转为16字节的方法

    2023-09-17 18:46:37
  • Discuz7 的提示效果如何实现

    2010-01-13 13:10:00
  • 深入理解pytorch库的dockerfile

    2021-01-11 23:28:54
  • PHP实现获取客户端IP并获取IP信息

    2023-06-18 08:34:26
  • asp之家 网络编程 m.aspxhome.com