pandas DataFrame 赋值的注意事项说明(index)
作者:ruguowoshiyu 发布时间:2023-03-08 06:42:58
一 pandas DataFrame一列赋值问题
说明,把b的列赋值给a
情况1:a,b index设置相同
如下代码
import pandas as pd
import numpy as np
a = pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
b = pd.DataFrame(np.array([11,22,33,44]),index=list('abcd'),columns=['m'])
a['m'] = b['m']
print(a)
上述代码结果如下
w x y z m
a 0 1 2 3 11
b 4 5 6 7 22
c 8 9 10 11 33
d 12 13 14 15 44
情况一是最基本的情况,结果也符合预期,之所以符合预期是因为a,b都设有同样的index,赋值操作按照index来到。如果b不设置Index,而是使用默认的index呢?
情况2:b的index采用默认值
代码如下
import pandas as pd
import numpy as np
a = pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
b = pd.DataFrame(np.array([11,22,33,44]),columns=['m'])
a['m'] = b['m']
print(a)
结果如下
w x y z m
a 0 1 2 3 NaN
b 4 5 6 7 NaN
c 8 9 10 11 NaN
d 12 13 14 15 NaN
情况二,结果超出了想象,b中的index为0,1,2,3与a中的index(‘a',‘b',‘c',‘d')不同,在赋值的过程中,是按照a中的index在b中找index相同位置的值,由于index不同,因此,给a赋值为NaN
情况三 : b中的部分Index与a中的相同
代码如下
import pandas as pd
import numpy as np
a = pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
b = pd.DataFrame(np.array([11,22,33,44]),index=list('arpb'),columns=['m'])
a['m'] = b['m']
print(a)
结果如下
w x y z m
a 0 1 2 3 11.0
b 4 5 6 7 44.0
c 8 9 10 11 NaN
d 12 13 14 15 NaN
由情况三结果可知,只有Index相同的行,赋值才能成功
总结:
从以上可以看出,Pandas DataFrame严格按照Index进行赋值,如果Index不同的话,则赋值为NaN
补充:python编程过程中DataFrame修改特定单元格值后原数据不变的一个解决方案
最近在参加了一个比赛,里面设计到数据清洗的工作,需要对一些异常值作出修改,往常我都是这样操作的
df[condition]['column'].iloc[0:3] = ......
或者
df[condition]['column'][0:3] = ......
里面condition代表满足条件的逻辑表达式,column表示列名
一般还是管用的,但偶尔会出现错误,主要是df[condition]这种表达在python里面是不够规范的,因此运行以后单元格容易赋值失败。在尝试了很多种方法之后,最后还是使用规范的loc或者iloc表达
df.loc[[row condition],['column']] = ......
例如:
NA.loc[[23,29,49],'北美整体规模'] = ......
或者
df.iloc[np.where(condition),[1:3]]
注意loc里面接的是具体的行列名称,iloc里面接的是满足条件的行列名称所对应的位置数字列表,切忌弄混!
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。
来源:https://blog.csdn.net/ruguowoshiyu/article/details/79820824


猜你喜欢
- #共有方法 + * instra='人生苦短'strb='我用python'lista=list(range
- 一、标准的数据集流程梳理分为几个步骤数据准备以及加载数据库–>数据加载器的调用或者设计–>
- Python实现GIF动图的提取及合成在开始之前,先来一个动图开头(预览)图片转GIF动图1、准备工作在开始合并前,先明确要转换哪些图片,以
- Excel 中的每一个单元,都会有这些属性:颜色(colors)、number formatting、字体(fonts)、边界(border
- 优化的思路一般是: 第一个是尽量降低向客户端同步对象的数量,第二个是尽量降低单个对象向客户端同步的数据."九宫格"是最常
- mysqli对prepare的支持对于大访问量的网站是很有好处的,它极大地降低了系统开销,而且保证了创建查询的稳定性和安全性。prepare
- anaconda中安装的python环境中没有pip3在使用anaconda配置的python环境时,发现在python环境中并没有安装pi
- Mysql的安装方法 安装mysql的步骤如下:请注意按图中所示,有些选项和默认是不一样的。同时,如果您是重新安装mysql的话,要注意先备
- mysql 8.0.12 的安装,折腾了两天,遇到各种问题,现总结如下:第一步,卸载掉之前安装的MySQL,参考彻底卸载mysql 个人亲测
- MySQL Workbench - 建模和设计工具1.模型是大多数有效和高性能数据库的核心。MySQL workbench具有允许开发人员和
- 需求背景用python进行文件的创建和读写操作时,我们很少关注所创建的文件的权限配置。对于一些安全性较高的系统,如果我们创建的文件权限其他用
- 最近开发了一个网站,大量采用了html5和css3,希望用户都以webkit内核打开页面,但是测试却发现360的以ie内核打开为推荐模式,不
- 关于中大型开发b/s开发中的缓存(cache),我的一些看法,有不正确的或者是有笔误的地方,请指正。thanks首先,应该了解基本的,对于缓
- 本文实例讲述了Python日志logging模块功能与用法。分享给大家供大家参考,具体如下:本文内容:logging模块的介绍logging
- 本文实例讲述了Python实现字符串反转的常用方法。分享给大家供大家参考,具体如下:下面是实现python字符串反转的四种方法:1. 切片d
- 本文实例讲述了Python基于socket模块实现UDP通信功能。分享给大家供大家参考,具体如下:一 代码1、接收端import socke
- 导言:当向类型化的数据集(Typed DataSet)添加一个TableAdapter时,相应的DataTable的构架已经由TableAd
- undetected_chromedriver是专门针对浏览器识别做出来的拓展直接使用undetected_chromedriver第三方库
- 在分析sIFR之前,先来快速的了解一下sIFR是什么,以及它是如何工作的。sIFR表示scalable Inman Flash Replac
- 冒泡排序冒泡排序(英语:Bubble Sort)是一种简单的排序算法。它重复地遍历要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们