Pandas中df.loc[]与df.iloc[]的用法与异同 

作者:三头六臂的小白 时间:2023-01-24 07:57:04 

官网资料:

loc  :https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.loc.html
iloc  : https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.iloc.html

用 途:

  • 取数: 从dataframe中取 一部分行与列的数据 (为主)

  • 赋值: 给指定的 行与列赋值 df.loc[xx,xx] = xx

输入参数注意:

方括号内的参数:

  • loc、iloc 方括号中,参数的排布模式为[行条件,列条件],当总体条件只有一个时候(最外层方括号内无逗号),会按照:先行后列的方法来匹配对应的条件

  • 默认会抛弃掉对应的dataframe格式,输出series,如果想保留dataframe格式,需要在条件外边加 ”[ ]”。

loc与iloc条件(行/列)相同之处:

  • 单一元素(不包含list) str/int/slice 选取行时候,选取的是对应条件下的行 (series)

  • 单一元素(不包含list) str/int/slice 选取列时候,选取的是对应条件下的列(series)

  • 条件为list时候,选取的是一组对应的 行(列) 条件下的(dataframe数据)

  • 布尔值的list/可与df对齐的series(布尔类型): 与index长度相同的话 选择对应值为True的行,与列数相同的话,选取对应值为True 的列。

  • df的index的子集index2: 选取df中对应的index2的行

  • 函数:输入为行/列series(外层有逗号)或者dataframe(外层无括号) 返回为对应输入的一个布尔值表,用来筛选对应的数据。

不同之处:

  • 当对应的行/列标签为 int类型x时候,iloc表示对应的第x个 index或column,而loc 表示对应的index /column名称等于这个x。

  • 对应的开闭区间不同  df.loc[1:5,1:5] 会有一个最多 5x5的df数据子集,而df.iloc[1:5,1:5] 会有最多4x4df数据子集,其中iloc的行/列切片不包含最后一个数(与range函数类似)

loc与iloc 实际用例:

df = pd.DataFrame([[1, 2,3,14], [4, 5,6,17], [7, 8,9,10],[11,12,13,14]],
     index=[2,3,4,5],
     columns=[2,4,5,6])
  
# loc 行/列条件是对应的标签值在对应的范围内,[闭合,闭合] 区间
df.loc[2:5,2:5]
#   输出为:
#    2    4    5
#2    1    2    3
#3    4    5    6
#4    7    8    9
#5    11    12    13
 
# 选取index 为 2 的行里面的值
# 不推荐:df.loc[2] 下文省略
df.loc[2,:]
# 输出为  1,2,3,14 series类型
 
# 选取index 为 2 的行 保留dataframe类型
df.loc[[2],:] 
 
#选取对应列名为 2 的列
df.loc[:,2] 
# 这里 index 与 列名都是int类型,因此loc方括号中使用int类型,如果是其他类型,对应的数字要改成其他类型的数据,不能再用数字
 
# iloc 行/列条件是对应的标签或者列名的索引值在范围内,[闭合,开放) 区间
df.iloc[2:5,2:5]
# 输出为 
#    5     6
#4     9     10
#5     13     14
 
# 这里 索引是以0开始的,所有行的切片应该写作 0:5  也可以写作“ :”
# iloc 数字类型来做筛选的
 
# 不管是loc 还是 iloc 都建议用[行条件,列条件] 来写,其中如果无需筛选可以用:来占位,表意明确。
# loc 匹配的是 index/列名的值 与对应的条件
# iloc 匹配的是 index/列名对应的索引号 与对应的条件

来源:https://blog.csdn.net/bf96163/article/details/122304597

标签:Pandas,df.loc[],df.iloc[]
0
投稿

猜你喜欢

  • Python入门教程(三十一)Python的Try和Except

    2022-02-26 01:21:14
  • django+js+ajax实现刷新页面的方法

    2021-04-19 05:22:20
  • 利用Tensorflow构建和训练自己的CNN来做简单的验证码识别方式

    2021-02-07 14:24:18
  • 新手入门:防范SQL注入攻击的新办法

    2009-03-11 15:14:00
  • banner字体设计与应用

    2009-07-06 14:42:00
  • Flask模拟实现CSRF攻击的方法

    2023-11-18 16:21:39
  • 网页设计十大诀窍

    2007-10-19 13:03:00
  • 用python实现名片管理系统

    2022-03-27 09:34:33
  • Python面向对象总结及类与正则表达式详解

    2021-08-12 13:23:34
  • 对Python的zip函数妙用,旋转矩阵详解

    2023-06-09 12:42:45
  • python 读取.csv文件数据到数组(矩阵)的实例讲解

    2023-08-10 12:12:36
  • python执行系统命令4种方法与比较

    2022-12-13 12:55:59
  • 小白教程|一小时上手最流行的前端框架vue(推荐)

    2024-04-30 10:34:20
  • Mybatis实现分包定义数据库的原理与过程

    2024-01-23 12:33:55
  • 细谈Mysql的存储过程和存储函数

    2024-01-23 11:05:24
  • mysql中如何查看表空间

    2024-01-27 00:25:25
  • jQuery结合CSS制作漂亮的select下拉菜单

    2024-04-19 09:58:32
  • mysql慢查询的分析方法

    2010-08-03 14:51:00
  • Git创建子分支,合并分支并提交

    2022-01-16 19:27:29
  • javascript中的Function.prototye.bind

    2024-04-22 22:35:59
  • asp之家 网络编程 m.aspxhome.com