numpy.random.Generator.choice#

method

random.Generator.choice(a, size=None, replace=True, p=None, axis=0, shuffle=True)#

从给定数组生成一个随机样本

参数:
a{array_like, int}

如果是一个 ndarray,则会从其元素中生成一个随机样本.如果是一个 int,则会从 np.arange(a) 中生成随机样本.

size{int, tuple[int]}, 可选

输出形状.如果给定的形状是,例如 (m, n, k) ,则从 1-d a 中抽取 m * n * k 个样本.如果 a 具有多个维度,则 size 形状将插入到 axis 维度中,因此输出 ndim 将是 a.ndim - 1 + len(size) .默认为 None,在这种情况下,将返回单个值.

replacebool, 可选

样本是否进行替换.默认为 True,这意味着可以多次选择 a 的一个值.

p1-D 类数组,可选

与 a 中每个条目相关联的概率.如果未给出,则样本假定在 a 中的所有条目上具有均匀分布.

axis整数,可选

执行选择的轴.默认值 0 按行选择.

shufflebool, 可选

在不进行替换的情况下进行抽样时,是否对样本进行洗牌.默认值为 True,False 可加快速度.

返回:
样本单个项目或 ndarray

生成的随机样本

提出:
ValueError

如果 a 是一个小于零的 int,如果 p 不是 1 维的,如果 a 是大小为 0 的类数组,如果 p 不是概率向量,如果 a 和 p 的长度不同,或者如果 replace=False 并且样本大小大于总体大小.

注释

通过 p 设置用户指定的概率使用比默认值更通用但效率更低的采样器.即使 p 的每个元素都是 1 / len(a),通用采样器也会生成与优化采样器不同的样本.

当转换为 float64 时, p 必须总和为 1.为确保这一点,您可能希望使用 p = p / np.sum(p, dtype=float) 进行归一化.

当将 a 作为整数类型传递并且未指定 size 时,返回类型是原生 Python int .

示例

从大小为 3 的 np.arange(5) 生成均匀随机样本:

>>> rng = np.random.default_rng()
>>> rng.choice(5, 3)
array([0, 3, 4]) # random
>>> #This is equivalent to rng.integers(0,5,3)

从大小为 3 的 np.arange(5) 生成非均匀随机样本:

>>> rng.choice(5, 3, p=[0.1, 0, 0.3, 0.6, 0])
array([3, 3, 0]) # random

从大小为 3 的 np.arange(5) 生成不进行替换的均匀随机样本:

>>> rng.choice(5, 3, replace=False)
array([3,1,0]) # random
>>> #This is equivalent to rng.permutation(np.arange(5))[:3]

从二维数组的第一轴(默认值)生成不进行替换的均匀随机样本:

>>> rng.choice([[0, 1, 2], [3, 4, 5], [6, 7, 8]], 2, replace=False)
array([[3, 4, 5], # random
       [0, 1, 2]])

从大小为 3 的 np.arange(5) 生成不进行替换的非均匀随机样本:

>>> rng.choice(5, 3, replace=False, p=[0.1, 0, 0.3, 0.6, 0])
array([2, 3, 0]) # random

以上任何一种都可以用任意类数组(而不仅仅是整数)重复进行.例如:

>>> aa_milne_arr = ['pooh', 'rabbit', 'piglet', 'Christopher']
>>> rng.choice(aa_milne_arr, 5, p=[0.5, 0.1, 0.1, 0.3])
array(['pooh', 'pooh', 'pooh', 'Christopher', 'piglet'], # random
      dtype='<U11')