numpy.random.Generator.hypergeometric#

method

random.Generator.hypergeometric(ngood, nbad, nsample, size=None)#

从超几何分布中抽取样本.

样本是从具有指定参数的超几何分布中抽取的,参数包括 ngood (进行良好选择的方式数), nbad (进行不良选择的方式数)和 nsample (抽取的项目数,小于或等于总和 ngood + nbad ).

参数:
ngoodint 或 ints 的类数组对象

进行良好选择的方式数.必须是非负数且小于 109.

nbadint 或 ints 的类数组对象

进行不良选择的方式数.必须是非负数且小于 109.

nsampleint 或 ints 的类数组对象

抽取的项目数.必须是非负数且小于 ngood + nbad .

sizeint 或 int 的元组,可选.

输出形状.如果给定的形状是例如 (m, n, k) ,则抽取 m * n * k 个样本.如果size是 None (默认),如果 ngood , nbadnsample 都是标量,则返回单个值.否则,抽取 np.broadcast(ngood, nbad, nsample).size 个样本.

返回:
outndarray 或标量

从参数化的超几何分布中抽取的样本.每个样本都是从一组 ngood 个好项目和 nbad 个坏项目中随机选择的大小为 nsample 的子集中的好项目数.

参见

multivariate_hypergeometric

从多元超几何分布中抽取样本.

scipy.stats.hypergeom

概率密度函数,分布或累积密度函数等.

注释

超几何分布的概率质量函数 (PMF) 为

\[P(x) = \frac{\binom{g}{x}\binom{b}{n-x}}{\binom{g+b}{n}},\]

其中 \(0 \le x \le n\)\(n-b \le x \le g\)

对于 P(x),抽取的样本中出现 x 个好结果的概率,g = ngood ,b = nbad ,n = nsample .

考虑一个装有黑色和白色弹珠的瓮,其中有 ngood 个是黑色的, nbad 个是白色的.如果抽取 nsample 个球而不放回,则超几何分布描述了抽取样本中黑球的分布.

请注意,此分布与二项式分布非常相似,但在此情况下,样本是在不放回的情况下抽取的,而在二项式情况下,样本是在放回的情况下抽取的(或者样本空间是无限的).随着样本空间变大,此分布接近于二项式分布.

参数 ngoodnbad 必须都小于 109 .对于非常大的参数,用于计算样本的算法 [4] 会因浮点计算中精度的损失而崩溃.对于如此大的值,如果 nsample 也不是很大,则可以使用二项式分布 binomial(n=nsample, p=ngood/(ngood + nbad)) 来近似分布.

参考

[1]

Lentner, Marvin, “Elementary Applied Statistics”, Bogden and Quigley, 1972.

[2]

Weisstein, Eric W. “Hypergeometric Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.wolfram.com/HypergeometricDistribution.html

[3]

Wikipedia,“超几何分布”,https://en.wikipedia.org/wiki/Hypergeometric_distribution

[4]

Stadlober, Ernst, “生成离散随机变量的均匀比方法”, Journal of Computational and Applied Mathematics, 31, pp. 181-189 (1990).

示例

从分布中抽取样本:

>>> rng = np.random.default_rng()
>>> ngood, nbad, nsamp = 100, 2, 10
# number of good, number of bad, and number of samples
>>> s = rng.hypergeometric(ngood, nbad, nsamp, 1000)
>>> from matplotlib.pyplot import hist
>>> hist(s)
#   note that it is very unlikely to grab both bad items

假设你有一个装有 15 个白色和 15 个黑色弹珠的罐子.如果你随机抽出 15 个弹珠,那么其中 12 个或更多是同一种颜色的可能性有多大?

>>> s = rng.hypergeometric(15, 15, 15, 100000)
>>> sum(s>=12)/100000. + sum(s<=3)/100000.
#   answer = 0.003 ... pretty unlikely!