python中pandas操作apply返回多列的实现

作者:xiaozheng123121 时间:2023-03-04 06:46:44 

我们可以用DataFrame的apply函数实现对多列,多行的操作。

需要记住的是,参数axis设为1是对列进行操作,参数axis设为0是对行操作。默认是对行操作。

apply 返回多列

# height = [70, 90, 100, 120, 140, 160, 180, 200,220,240, 260] # 长度为 11
# df.shape   (1000, 11)
# 对df的每一行的每一个元素操作,然后再返回多列
#----------返回多列-----------------
df = df.apply(lambda x: pd.Series([math.atan(i[0]/(i[1])*180/math.pi for i in zip(height, x)]).astype(float), axis=1)
.rename(columns=dict(zip(list(range(0, 11)), df.columns)))

#df['slope'] = df_10min.apply(lambda x: math.atan(210 / (x['ws_260'] - x['ws_50'] + 1e-7))*180/math.pi, axis=1)
import pandas as pd
df_tmp = pd.DataFrame([
    {"a":"data1", "cnt":100},{"a":"data2", "cnt":200},
])

df_tmp
a    cnt
data1    100
data2    200

方法一:使用apply 的参数result_type 来处理
def formatrow(row):
    a = row["a"] + str(row["cnt"])
    b = str(row["cnt"]) + row["a"]
    return a, b 
 
df_tmp[["fomat1", "format2"]] = df_tmp.apply(formatrow, axis=1, result_type="expand")
df_tmp
a    cnt    fomat1    format2
data1    100    data1100    100data1
data2    200    data2200    200data2

方法一:使用zip打包返回结果来处理
df_tmp["fomat1-1"], df_tmp["format2-2"] = zip(*df_tmp.apply(formatrow, axis=1))
df_tmp
a    cnt    fomat1    format2    fomat1-1    format2-2
data1    100    data1100    100data1    data1100    100data1
data2    200    data2200    200data2    data2200    200data2

生成新列

现在有如下一个DataFrame:

np.random.seed(1)
df = pd.DataFrame(np.random.randn(4,2), columns=['A', 'B'])
df
>>>
      A    B
0    1.624345    -0.611756
1    -0.528172    -1.072969
2    0.865408    -2.301539
3    1.744812    -0.761207

对A, B两列操作,生成C列, 其中C是字符串,由A ± B组成。下面看一下结果就明白了。

df['C'] = df.apply(lambda x: '{:.2f}±{:.2f}'.format(x['A'], x['B']), axis=1)

看一下效果

    A    B    C
0    1.624345    -0.611756    1.62±-0.61
1    -0.528172    -1.072969    -0.53±-1.07
2    0.865408    -2.301539    0.87±-2.30
3    1.744812    -0.761207    1.74±-0.76

多行操作举例

同理可以作用在多行上。

# 对第 10 行进行操作,基于第2、3两行
df.loc[10] = df.apply(lambda x: '{:.2f}±{:.2f}'.format(x[2], x[3]) )

看一下实现的效果

       A    B
0    1.624345    -0.611756
1    -0.528172    -1.072969
2    0.865408    -2.301539
3    1.744812    -0.761207
10    0.87±1.74    -2.30±-0.76

参考链接

[1] pandas的DataFrame使用apply实现对多列,多行操作 2021.12
[2] pandas 的apply返回多列,并赋值 2020.4

来源:https://blog.csdn.net/weixin_46713695/article/details/125958501

标签:pandas,apply,返回多列
0
投稿

猜你喜欢

  • Python数据分析Numpy中常用相关性函数

    2022-03-26 08:25:34
  • python显示天气预报

    2022-04-22 23:46:38
  • 一篇文章告诉你如何用python进行自动化测试,调用c程序

    2021-10-08 09:14:49
  • JS实现TITLE悬停长久显示效果完整示例

    2024-04-16 09:54:00
  • Python学习笔记之Break和Continue用法分析

    2023-02-12 04:55:32
  • JavaScript中的私有成员 Javascript教程

    2008-12-02 17:57:00
  • python实现Excel文件转换为TXT文件

    2021-01-15 05:24:54
  • SQL Server 全文搜索功能介绍

    2024-01-27 13:50:45
  • python 变量初始化空列表的例子

    2022-09-03 08:14:42
  • CSS网页布局扩展小技巧

    2010-06-03 12:13:00
  • VS2013设置护眼背景颜色

    2023-06-28 12:59:02
  • python五子棋游戏的设计与实现

    2021-04-19 07:17:43
  • UEditor 编辑器跨域上传解决方法

    2022-09-07 11:52:41
  • anaconda中安装的python环境中没有pip3的问题及解决

    2022-07-19 08:45:34
  • asp中如何对ip段进行过滤限制

    2007-09-17 11:14:00
  • pycharm新建一个python工程步骤

    2023-08-22 17:42:54
  • 立足于传统行业设计

    2008-07-26 12:36:00
  • python标识符的用法及注意事项

    2023-05-02 03:03:04
  • 解决Navicat for MySQL 连接 MySQL 报2005错误的问题

    2024-01-16 13:13:26
  • IE6绝对定位的bug及其解决办法

    2011-03-30 12:31:00
  • asp之家 网络编程 m.aspxhome.com