使用pandas忽略行列索引,纵向拼接多个dataframe

作者:呆萌的代Ma 时间:2022-05-23 08:52:42 

从wind上面搞到一批股票数据后发现:本来是一个类型的数据,但是由于季度不同,列名也不同,导致使用pandas合并多个报表的时候总是出现一大堆NaN,所以这里我写了一个函数,专门针对这样的表

它的思路是:

生成一堆单词,然后把这些表的列索引全部替换为这些单词,然后调用 pd.concat() 把这些dataframe全部合并后再把列索引改回来,当然,这里也可以手动指定列索引。

使用方法见代码的最后一行,传入一个dataframe的list就可以了。


import pandas as pd
from random import Random

# 随机生成一堆单词作为公共的列名
def random_list(random_str_count, randomlengtd=6):
result_list = []
random = Random()
chars = "qwertyuiopasdfghjklzxcvbnm"
for str_count in range(random_str_count):
ranstr = ""
lengtd = len(chars) - 1
for str_lengtd in range(randomlengtd):
ranstr += chars[random.randint(0, lengtd)]
result_list.append(ranstr)
return result_list

def combine_as_data_location(pd_list, columns=''):
if not pd_list:
return None
old_columns = pd_list[0].columns
if columns:
new_columns = columns
else:
new_columns = random_list(pd_list[0].shape[1])
for data_df in pd_list:
# data is pandas Dataframe
data_df.columns = new_columns
result_df = pd.concat(pd_list, ignore_index=True)
if columns:
return result_df
else:
result_df.columns = old_columns
return result_df
result_df = combine_as_data_location([df1,df2,df3])

补充:pandas.concat实现竖着拼接、横着拼接DataFrame

1、concat竖着拼接(默认的竖着,axis=0)

话不多说,直接看例子:


import pandas as pd
df1=pd.DataFrame([10,12,13])
df2=pd.DataFrame([22,33,44,55])
df3=pd.DataFrame([90,94])

df1


0
010
112
213

df2


0
022
133
244
355

df3


0
090
194

res= pd.concat([df1,df2,df3])
res

0
010
112
213
022
133
244
355
090
194

如果要生成新索引,忽略原来索引怎么办?

默认有个参数ignore_index= False,将其值改为True:


res2= pd.concat([df1,df2,df3], ignore_index=True)
res2

0
010
112
213
322
433
544
655
790
894

2、concat横着拼接

用参数axis= 1,看例子:


res_heng= pd.concat([df1,df2,df3], axis=1)
res_heng

000
010.02290.0
112.03394.0
213.044NaN
3NaN55NaN

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

来源:https://blog.csdn.net/weixin_35757704/article/details/90177680

标签:pandas,索引,纵向,拼接,dataframe
0
投稿

猜你喜欢

  • js获取select选中的option的text示例代码

    2024-04-19 09:58:48
  • 实用的 vue tags 创建缓存导航的过程实现

    2024-05-29 22:45:55
  • Python中处理字符串之endswith()方法的使用简介

    2023-02-25 09:05:36
  • 基于PHP常用文件函数和目录函数整理

    2023-06-09 22:02:34
  • python创建学生成绩管理系统

    2023-08-09 04:19:38
  • python实现彩票系统

    2021-04-12 21:16:42
  • Monster for Chrome

    2010-05-04 16:30:00
  • Python如何获取文件路径/目录

    2021-09-01 09:05:18
  • SqlServer数据库全角转换成半角

    2024-01-21 11:20:39
  • python利用多种方式来统计词频(单词个数)

    2021-12-23 14:52:32
  • 学习ASP.NET八天入门:第七天

    2007-08-07 13:52:00
  • Python网络编程之ftplib模块

    2021-12-11 01:49:37
  • RichTextBox 显示图片和word的代码

    2023-06-28 18:27:12
  • pip如何用pipdeptree查看包依赖

    2022-07-28 01:56:26
  • python实现可变变量名方法详解

    2021-04-23 11:42:49
  • 深入理解python中函数传递参数是值传递还是引用传递

    2022-02-21 10:08:33
  • Go语言中的Slice学习总结

    2023-07-22 23:33:37
  • MySQL如何优化查询速度

    2024-01-17 05:38:04
  • MySQL 两张表数据合并的实现

    2024-01-28 07:25:49
  • URL编码与SQL注入

    2007-09-26 12:41:00
  • asp之家 网络编程 m.aspxhome.com