Python Pandas创建Dataframe数据框的六种方法汇总

作者:AHU-丁少侠 时间:2023-08-25 07:39:16 

创建Dataframe主要是使用pandas中的DataFrame函数,其核心就是第一个参数:data,传入原始数据,因此我们可以据此给出六种创建Dataframe的方法:(示例代码环境:jupyter:python3.8)

一、字典类

方法1:列表、数组或元组构成的字典构造Dataframe

直接上代码:

import pandas as pd
import numpy as np
dic = {"a": [1, 2, 3, 4], #列表
      "b": np.array([4, 5, 6, 7]), #数组
      "c": (1, 2, 3, 4)} #元组
data = pd.DataFrame(dic) # 创建Dataframe
data

运行结果:

Python Pandas创建Dataframe数据框的六种方法汇总

可以看到,一个新的数据框已经创建成功了。系统默认为我们生成了行索引,而列索引就是字典dic里的key,我们也可以在创建Dataframe时手动指定行索引,只需修改参数index

import pandas as pd
import numpy as np
dic = {
   "a": [1, 2, 3, 4],  # 列表
   "b": np.array([4, 5, 6, 7]),  # 数组
   "c": (1, 2, 3, 4),
}  # 元组
data = pd.DataFrame(dic, index=["一", "二", "三", "四"])  # 创建Dataframe
data

运行结果:

Python Pandas创建Dataframe数据框的六种方法汇总

那么如果事后我们后悔了,觉得我们起的列索引的名字不好听,怎么修改呢?只需修改Dataframecolumns属性:

data.columns = ["A", "B", "C"]
data

结果如下:

Python Pandas创建Dataframe数据框的六种方法汇总

读者也可以尝试修改Dataframeindex属性。

方法2:Series构成的字典构造Dataframe

import pandas as pd
import numpy as np
dic = {"a": pd.Series([1, 2, 3, 4]),
      "b": pd.Series([4, 5, 6, 7])}
data = pd.DataFrame(dic)  # 创建Dataframe
data

运行结果:

Python Pandas创建Dataframe数据框的六种方法汇总

方法3:字典构成的字典构造Dateframe

import pandas as pd
import numpy as np
dic = {"a": {"一": 1, "二": 2},
      "b": {"一": 10, "二": 20},
      "c": {"一": 100, "二": 200}}
data = pd.DataFrame(dic)  # 创建Dataframe
data

运行结果:

Python Pandas创建Dataframe数据框的六种方法汇总

其中:外层的a,b,c这三个key作为了列索引,内层的一,二作为了行索引。读者可以尝试为字典dic再添加一个元素:"d":{"一": 100},看看创建出来的Dataframe长什么样,这个结果会给你什么启示?

二、列表类

方法1:二维数组构造Dataframe

import pandas as pd
import numpy as np
ls = np.arange(12).reshape(3, 4)  # 创建二维数组
data = pd.DataFrame(ls)
data

运行结果:

Python Pandas创建Dataframe数据框的六种方法汇总

方法2:字典列表构造Dataframe

import pandas as pd
import numpy as np
ls = [{"一": 1, "二": 2},
     {"一": 10, "二": 20},
     {"一": 100, "二": 200}]
data = pd.DataFrame(ls)
data

运行结果:

Python Pandas创建Dataframe数据框的六种方法汇总

可以看到,列表中的字典的key作为了列索引,这个就很像关系型数据库里的字段和值。读者要注意和字典类中方法3的区别。

方法3:Series列表构造Dataframe

import pandas as pd
import numpy as np
ls = [pd.Series([1, 2, 3, 4]),
     pd.Series([4, 5, 6, 7])]
data = pd.DataFrame(ls)
data

运行结果:

Python Pandas创建Dataframe数据框的六种方法汇总

三、小结

笔者为读者提供了六种方法创建Dataframe,这里总结一下:

1.细心的读者可能会发现:

在字典类中,字典最外层的key都作为了列索引,而则作为某一行的值;

在列表类中,列表的每一个元素都作为了某一行的值。

2.读者需要在实际数据处理时,根据处理数据的特点选择合适的方式创建Dataframe

来源:https://blog.csdn.net/DY7778F/article/details/119782352

标签:Python,Pandas,Datafram
0
投稿

猜你喜欢

  • DreamweaverMX2004技巧两则

    2010-09-05 21:10:00
  • 算法系列15天速成 第十一天 树操作(上)

    2022-08-03 13:03:56
  • 详解MySQL中InnoDB的存储文件

    2024-01-13 04:58:00
  • Mysql InnoDB引擎中的数据页结构详解

    2024-01-16 20:51:29
  • Python通过类的组合模拟街道红绿灯

    2021-04-13 02:00:24
  • go-cqhttp智能聊天功能的实现

    2024-04-26 17:30:53
  • ASP实现最简洁的多重查询的解决方案

    2007-09-28 12:00:00
  • PHP实现统计代码行数小工具

    2023-11-15 18:53:20
  • 基于python生成英文版词云图代码实例

    2023-06-24 23:43:14
  • python 利用opencv实现图像网络传输

    2023-05-27 12:52:16
  • Python中的flask框架详解

    2021-03-20 20:23:59
  • SQL Server数据库对上亿表的操作

    2008-11-16 18:13:00
  • 22个HTML5的初级技巧

    2010-12-17 12:39:00
  • oracle常用函数汇总(分享)

    2024-01-12 17:03:56
  • js实现单机双人象棋设计分析

    2008-05-20 12:57:00
  • vue多页面项目实现版本快照功能示例详解

    2024-04-28 09:23:25
  • Golang算法之田忌赛马问题实现方法分析

    2023-06-29 06:07:24
  • Python matplotlib seaborn绘图教程详解

    2021-03-12 03:23:07
  • 二维码的生成细节和原理

    2023-02-28 16:36:01
  • FrontPage XP设计教程2——网页的编辑

    2008-10-11 12:16:00
  • asp之家 网络编程 m.aspxhome.com