Python pandas DataFrame操作的实现代码

作者:huahuayu 时间:2021-07-24 00:49:43 

1. 从字典创建Dataframe


>>> import pandas as pd
>>> dict1 = {'col1':[1,2,5,7],'col2':['a','b','c','d']}
>>> df = pd.DataFrame(dict1)
>>> df
 col1 col2
0   1  a
1   2  b
2   5  c
3   7  d

2. 从列表创建Dataframe (先把列表转化为字典,再把字典转化为DataFrame)


>>> lista = [1,2,5,7]
>>> listb = ['a','b','c','d']
>>> df = pd.DataFrame({'col1':lista,'col2':listb})
>>> df
 col1 col2
0   1  a
1   2  b
2   5  c
3   7  d
 

3. 从列表创建DataFrame,指定data和columns




>>> a = ['001','zhangsan','M']
>>> b = ['002','lisi','F']
>>> c = ['003','wangwu','M']
>>> df = pandas.DataFrame(data=[a,b,c],columns=['id','name','sex'])
>>> df
 id   name sex
0 001 zhangsan  M
1 002   lisi  F
2 003  wangwu  M

4. 修改列名,从['id','name','sex']修改为['Id','Name','Sex']


>>> df.columns = ['Id','Name','Sex']
>>> df
 Id   Name Sex
0 001 zhangsan  M
1 002   lisi  F
2 003  wangwu  M

5. 调整DataFrame列顺序、调整列编号从1开始
https://www.jb51.net/article/163644.htm

6. DataFrame随机生成10行4列int型数据


>>> import pandas
>>> import numpy
>>> df = pandas.DataFrame(numpy.random.randint(0,100,size=(10, 4)), columns=list('ABCD')) # 0,100指定随机数为0到100之间(包括0,不包括100),size = (10,4)指定数据为10行4列,column指定列名
>>> df
 A  B  C  D
0 67 28 37 66
1 21 27 43 37
2 73 54 98 85
3 40 78  4 93
4 99 60 63 16
5 48 46 24 61
6 59 52 62 28
7 20 74 36 64
8 14 13 46 60
9 18 44 70 36

7. 用时间序列做index名


>>> df # 原本index为自动生成的0~9
 A  B  C  D
0 31 25 45 67
1 62 12 61 88
2 79 36 20 97
3 26 57 50 44
4 24 12 50  1
5  4 61 99 62
6 40 47 52 27
7 83 66 71  4
8 58 59 25 62
9 38 81 60  8
>>> import pandas
>>> dates = pandas.date_range('20180121',periods=10)
>>> dates # 从20180121开始,共10天
DatetimeIndex(['2018-01-21', '2018-01-22', '2018-01-23', '2018-01-24',
       '2018-01-25', '2018-01-26', '2018-01-27', '2018-01-28',
       '2018-01-29', '2018-01-30'],
      dtype='datetime64[ns]', freq='D')
>>> df.index = dates # 将dates赋值给index
>>> df
      A  B  C  D
2018-01-21 31 25 45 67
2018-01-22 62 12 61 88
2018-01-23 79 36 20 97
2018-01-24 26 57 50 44
2018-01-25 24 12 50  1
2018-01-26  4 61 99 62
2018-01-27 40 47 52 27
2018-01-28 83 66 71  4
2018-01-29 58 59 25 62
2018-01-30 38 81 60  8

8. dataframe 实现类SQL操作

pandas官方文档 Comparison with SQL

https://pandas.pydata.org/pandas-docs/stable/comparison_with_sql.html

来源:https://www.cnblogs.com/huahuayu/p/8227494.html

标签:Python,pandas,DataFrame
0
投稿

猜你喜欢

  • Python必备技能之debug调试教程详解

    2023-03-01 19:26:10
  • 改变链接,让别人永远找不到你的程序

    2008-09-13 18:57:00
  • 解析PHP中VC6 X86和VC9 X86的区别及 Non Thread Safe的意思

    2023-11-06 13:11:37
  • 用javascript实现select的美化

    2007-05-11 16:50:00
  • python+flask编写接口实例详解

    2022-10-09 16:09:41
  • 解决django migrate报错ORA-02000: missing ALWAYS keyword

    2023-04-15 14:19:54
  • 分享到豆瓣、百度空间、新浪微博的js代码

    2011-03-17 12:58:00
  • ASP读取MySQL数据库出现乱码的解决办法

    2010-03-08 14:25:00
  • 妄想or未来?界面的虚拟现实化

    2010-03-01 12:53:00
  • 使用字符串建立查询能加快服务器的解析速度吗?

    2010-07-14 21:03:00
  • Python实现求解一元二次方程的方法示例

    2023-09-15 03:29:41
  • 教你用FrontPage2003轻松布局网页

    2008-02-24 17:05:00
  • Python DataFrame.groupby()聚合函数,分组级运算

    2022-02-08 07:23:09
  • python 函数定位参数+关键字参数+inspect模块

    2023-07-05 23:04:37
  • CSS的学习应该注意学习方法

    2007-11-27 00:20:00
  • python实现凯撒密码、凯撒加解密算法

    2023-08-27 17:49:22
  • Python encode()方法和decode()方法详解

    2023-06-16 11:47:15
  • CSS图片代码效果汇总

    2008-09-04 12:14:00
  • python binascii 进制转换实例

    2021-03-25 10:56:25
  • Python全栈之列表数据类型详解

    2023-05-05 15:27:10
  • asp之家 网络编程 m.aspxhome.com