numpy排序与集合运算用法示例

作者:我的前进日志 时间:2022-08-25 10:23:06 

这里有numpy数组的相关介绍https://www.jb51.net/article/130657.htm

排序

numpy与python列表内置的方法类似,也可通过sort方法进行排序。

用法如下:


In [1]: import numpy as np
In [2]: x = np.random.randn(9)
In [3]: x
Out[3]:
array([-0.4041504 , -0.42198556, 0.92807217, -2.66609196, 1.50915897,
   0.38080873, 1.05325796, -1.16488798, 0.04062064])
In [4]: x.sort()
In [5]: x
Out[5]:
array([-2.66609196, -1.16488798, -0.42198556, -0.4041504 , 0.04062064,
   0.38080873, 0.92807217, 1.05325796, 1.50915897])

可以发现上述的sort方法是直接对x进行了排序而并没有创建一个副本。

但是np.sort()这个顶级的方法,会返回一个副本:


In [6]: x = np.random.randn(6)
In [7]: x
Out[7]:
array([ 0.14240205, 0.48903869, 0.22528632, 1.31659382, 0.00352338,
   0.95574862])
In [8]: np.sort(x)
Out[8]:
array([ 0.00352338, 0.14240205, 0.22528632, 0.48903869, 0.95574862,
   1.31659382])
In [9]: x
Out[9]:
array([ 0.14240205, 0.48903869, 0.22528632, 1.31659382, 0.00352338,
   0.95574862])

传入轴编号,可以实现在某一个轴向上进行排序。


In [34]: x = np.random.randn(5,4)
In [35]: x
Out[35]:
array([[-0.26646799, -0.40714749, -0.76788268, -0.25340467],
   [ 0.70099086, -0.88716684, 0.13461279, 2.14412835],
   [ 0.39718924, -0.14671297, -0.67821163, 1.85798273],
   [-0.29389289, 0.0346094 , 0.25213133, 0.87105479],
   [-0.10797243, 1.60188878, 0.67829493, 0.43291808]])
In [36]: s = x

In [37]: s.sort(0)#按列进行排序
In [38]: s
Out[38]:
array([[-0.29389289, -0.88716684, -0.76788268, -0.25340467],
   [-0.26646799, -0.40714749, -0.67821163, 0.43291808],
   [-0.10797243, -0.14671297, 0.13461279, 0.87105479],
   [ 0.39718924, 0.0346094 , 0.25213133, 1.85798273],
   [ 0.70099086, 1.60188878, 0.67829493, 2.14412835]])
In [39]: x
Out[39]:
array([[-0.29389289, -0.88716684, -0.76788268, -0.25340467],
   [-0.26646799, -0.40714749, -0.67821163, 0.43291808],
   [-0.10797243, -0.14671297, 0.13461279, 0.87105479],
   [ 0.39718924, 0.0346094 , 0.25213133, 1.85798273],
   [ 0.70099086, 1.60188878, 0.67829493, 2.14412835]])
In [40]: x = np.random.randn(5,4)
In [41]: x
Out[41]:
array([[ 0.82309157, -0.56413805, -0.1766557 , -0.31924962],
   [-1.25606694, 2.63622922, 2.47481377, 0.27840961],
   [ 0.63659583, 1.52779004, -0.90582752, 0.82325241],
   [-1.52664294, -0.5285837 , -1.96380368, -0.44323125],
   [ 1.94859294, 2.55676806, 1.53614848, -0.43366557]])
In [42]: x.sort(1)#按行进行排序
In [43]: x
Out[43]:
array([[-0.56413805, -0.31924962, -0.1766557 , 0.82309157],
   [-1.25606694, 0.27840961, 2.47481377, 2.63622922],
   [-0.90582752, 0.63659583, 0.82325241, 1.52779004],
   [-1.96380368, -1.52664294, -0.5285837 , -0.44323125],
   [-0.43366557, 1.53614848, 1.94859294, 2.55676806]])

在这儿,我试图将x赋值给s,结果发现对s排序后,x也变了,这说明,在内存中,实际上,s,x是指向同一组值得。

我也曾试图输入s.sort(2),结果出现了ValueError:axis(=2)outofbounds,这也就和前面的统计函数的axis参数是一致的。

那么也就是说,他的用法和axis一致。

利用排序,我们还能得到分位数(

分位数(英语:Quantile),亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。具体可自行搜索),从而得到特定位置的值。


In [44]: x = np.random.randn(500)
In [45]: x.sort()
In [46]: x[int(0.05 * len(x))] #5%分位数
Out[46]: -1.7657191623368329

还有很多没有深入了解,比如怎么降序排列,待续。

集合运算

unique(x)返回集合中的唯一值,并排序,其实也就是去除重复值。


In [1]: import numpy as np
In [2]: str = np.array(['s','f','r','s','d','f','w','r'])
In [3]: np.unique(str)
Out[3]:
array(['d', 'f', 'r', 's', 'w'],
  dtype='<U1')
In [4]: i = np.array([2,2,2,2,1,1,3,4,5,4,3,5])
In [5]: np.unique(i)
Out[5]: array([1, 2, 3, 4, 5])

intersect1d(x,y)返回集合A和B的交集,并排序


In [6]: k = np.arange(8)

In [7]: np.intersect1d(i, k)
Out[7]: array([1, 2, 3, 4, 5])

union1d(x,y)返回集合A和B的并集,并排序


In [8]: np.union1d(i,k)
Out[8]: array([0, 1, 2, 3, 4, 5, 6, 7])

in1d(x,y)返回一个A包含于B的布尔型数组


In [10]: np.in1d(k,i)
Out[10]: array([False, True, True, True, True, True, False, False], dtype=bool)

setdiff1d(x,y)集合的差,包含于A但不包含于B,相当于A-(A∩B)


In [12]: np.setdiff1d(k,i)
Out[12]: array([0, 6, 7])

setxor1d(x,y)存在于A中但不同时存在于B中,也就是对称差,说白了就是A和B交集之外的部分。

numpy排序与集合运算用法示例

就是红色的部分。


In [13]: s = np.arange(4,12)
In [14]: s
Out[14]: array([ 4, 5, 6, 7, 8, 9, 10, 11])
In [15]: np.setxor1d(s,k)
Out[15]: array([ 0, 1, 2, 3, 8, 9, 10, 11])

来源:http://www.cnblogs.com/sunshinewang/p/6905791.html

标签:numpy,数组运算,排序,集合
0
投稿

猜你喜欢

  • 如何用VScode配置Python开发环境

    2021-10-23 11:00:51
  • Django 大文件下载实现过程解析

    2021-12-18 20:48:32
  • python字符串常用方法

    2023-05-29 13:54:15
  • 解决go 生成的exe不在bin文件夹里的问题

    2024-03-16 20:49:52
  • Django学习笔记之View操作指南

    2023-05-29 14:08:47
  • 存贮查询与运行时查询孰优孰劣?

    2009-11-01 15:13:00
  • MySQL timestamp自动更新时间分享

    2024-01-22 11:48:21
  • js实现兼容性好的微软官网导航下拉菜单效果

    2024-04-22 13:09:20
  • VMware中安装CentOS7(设置静态IP地址)并通过docker容器安装mySql数据库(超详细教程)

    2024-01-14 02:58:23
  • Pytorch卷积神经网络resent网络实践

    2022-01-21 02:08:42
  • Python实现批量识别图片文字并存为Excel

    2021-07-28 06:34:23
  • Python实现一个发送程序和接收程序

    2023-06-18 09:04:38
  • python实操案例练习(七)

    2021-09-23 01:01:03
  • PyG搭建GCN模型实现节点分类GCNConv参数详解

    2022-08-22 19:58:49
  • Python计算程序运行时间的方法

    2023-08-09 09:53:50
  • js页面跳转常用的几种方式

    2023-08-07 08:30:27
  • python encode和decode的妙用

    2021-01-08 01:34:20
  • SQL Server中的XML数据类型详解

    2024-01-15 20:56:44
  • python实现简单的名片管理系统

    2022-12-28 21:19:05
  • 为你总结一些php信息函数

    2023-10-28 09:46:59
  • asp之家 网络编程 m.aspxhome.com