numpy.random.choice()函数详解

作者:山茶花开时。 时间:2023-04-30 09:46:03 

处理数据时我们经常需要从数组中随机抽取元素,这时候我们可以考虑使用np.random.choice()函数

语法格式

numpy.random.choice(a, size=None, replace=True, p=None)

参数说明

a:如果a是一维数组,就表示从这个一维数组中随机采样;如果a是整数,就表示从0到a-1这个序列中随机采样

size: 从a中选取size个数(采样结果的数量,以概率p随机选取大小为size的数据)

replace:布尔值,表示是否重用元素,即抽取出来的数据是否放回原数组中,默认为True(抽取出来的数据有重复)

p:一个一维数组,其与数组a相对应,表示取数组a中每个元素的概率,默认p=None表示选取的每个元素的概率相同

1.参数a

如果参数a=5,表示在[0, 5)中随机输出一个随机数

import numpy as np
np.random.choice(5)  # 3

如果参数a = ['Guangzhou', 'Beijing', 'Shanghai', 'Shenzhen'],表示在['Guangzhou', 'Beijing', 'Shanghai', 'Shenzhen']中随机输出一个随机数

import numpy as np
a = ['Guangzhou', 'Beijing', 'Shanghai', 'Shenzhen']
np.random.choice(a)  # 'Shenzhen'

2.参数size

在[0, 5)内输出3个数字并组成一维数组(ndarray)

import numpy as np
np.random.choice(5, 3)  # array([3, 2, 3])

在['Guangzhou', 'Beijing', 'Shanghai', 'Shenzhen']内输出3个值并组成一维数组(ndarry)

import numpy as np
a = ['Guangzhou', 'Beijing', 'Shanghai', 'Shenzhen']
# array(['Shanghai', 'Shenzhen', 'Shanghai'], dtype='<U9')
np.random.choice(a, size=3)

3.参数replace

replace=False表示非放回采样(不会出现重复的元素) 

import numpy as np
# array([4, 0, 3])
np.random.choice(a=5, size=3, replace=False, p=None)

replace=True表示放回采样(会出现重复的元素) 

import numpy as np
# array([1, 0, 0])
np.random.choice(a=5, size=3, replace=True, p=None)

4.参数p

参数p实际是个数组,数组元素的个数应该与指定的参数a相同,用来规定选取a中每个元素的概率,默认概率相同,我们可以使用参数p来按概率生成随机数

例子1

import numpy as np
# array([3, 4, 3], dtype=int64)
np.random.choice(5, 3, p=[0.1, 0.2, 0.3, 0.1, 0.3])

上述代码表示分别以p=[0.1, 0.2, 0.3, 0.1, 0.3]的概率从[0,1,2,3,4]这四个数中选取3个数 

例子2 

每天参加体育锻炼的时间是多少?

A.没时间锻炼

B.10-20分钟

C.20-40分钟

D.50分钟以上

假设有100人填上述选择题,该题共有4个选项(ABCD),我们如何按概率控制这100个人选择A的概率是0.3,B的概率是0.3,C的概率0.3,D的概率是0.1?

import numpy
lists = []
for i in range(1, 101):
   r = numpy.random.choice(a=numpy.arange(1,5), p=[0.3, 0.3, 0.3, 0.1])
   lists.append(r)
A = 0
B = 0
C = 0
D = 0
'''
数字1代表A
数字2代表B
数字3代表C
数字4代表D
'''
for i in lists:
   if i == 1:
       A = A + 1
   elif i == 2:
       B = B + 1
   elif i == 3:
       C = C + 1
   elif i == 4:
       D = D + 1
print("A选项个数:", A)
print("B选项个数:", B)
print("C选项个数:", C)
print("D选项个数:", D)

结果如下所示

A选项个数: 27
B选项个数: 26
C选项个数: 36
D选项个数: 11

来源:https://blog.csdn.net/Hudas/article/details/130546994

标签:numpy.random.choice()
0
投稿

猜你喜欢

  • python逐行读取文件内容的三种方法

    2023-01-05 14:07:30
  • 网页制作了解什么是CSS hack?

    2007-10-21 08:52:00
  • ASP中从数据库读取二进制文件数据代码

    2010-04-24 15:44:00
  • JavaScript的replace方法与正则表达式结合应用讲解

    2008-03-06 21:37:00
  • Django中modelform组件实例用法总结

    2023-09-28 14:35:49
  • python实现共轭梯度法

    2021-10-06 22:39:01
  • python 对象真假值的实例(哪些视为False)

    2021-11-18 02:50:49
  • 什么是用户体验优化(UEO)

    2008-08-27 19:49:00
  • Python设计密码强度校验程序

    2022-09-29 08:37:12
  • Golang控制协程执行顺序方法详解

    2024-02-20 13:00:21
  • MySQL中按照多字段排序及问题解决

    2024-01-22 02:31:47
  • Python Numpy教程之排序,搜索和计数详解

    2021-10-31 05:30:21
  • IE8 在元素尺寸大于(2048px/4096px)时 alpha滤镜渲染失败

    2010-01-05 16:39:00
  • python机器学习包mlxtend的安装和配置详解

    2021-11-09 22:53:06
  • python数字类型math库原理解析

    2021-11-27 16:34:50
  • Anaconda的安装与虚拟环境建立

    2022-05-26 01:06:22
  • JavaScript多种页面刷新方法小结

    2024-04-22 12:53:09
  • CSS3中的box-sizing属性

    2010-04-05 21:52:00
  • 解决python 虚拟环境删除包无法加载的问题

    2023-09-15 14:43:57
  • Python实现端口检测的方法

    2022-02-01 21:21:02
  • asp之家 网络编程 m.aspxhome.com