numpy.random.Generator.negative_binomial#

method

random.Generator.negative_binomial(n, p, size=None)#

从负二项分布中抽取样本.

样本从具有指定参数的负二项分布中抽取,参数为 n 次成功和 p 成功概率,其中 n > 0 且 p 在区间 (0, 1] 内.

参数:
nfloat 或 float 的类数组

分布的参数,> 0.

pfloat 或 float 的类数组

分布的参数.必须满足 0 < p <= 1.

sizeint 或 int 元组,可选

输出形状.例如,如果给定的形状是 (m, n, k) ,则抽取 m * n * k 个样本.如果 size 是 None (默认值),则当 np 都是标量时,返回单个值.否则,抽取 np.broadcast(n, p).size 个样本.

返回:
outndarray 或标量

从参数化的负二项分布中抽取的样本,其中每个样本等于 N,即达到总共 n 次成功之前发生的失败次数.

注释

负二项分布的概率质量函数为

\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]

其中 \(n\) 是成功的次数, \(p\) 是成功的概率, \(N+n\) 是试验的次数, \(\Gamma\) 是伽马函数. 当 \(n\) 是整数时, \(\frac{\Gamma(N+n)}{N!\Gamma(n)} = \binom{N+n-1}{N}\) ,这是 pmf 中此项的更常见形式. 负二项分布给出了在最后一次试验成功的情况下,给定 n 次成功时的 N 次失败的概率.

如果重复投掷骰子,直到第三次出现"1",那么在第三次"1"出现之前出现的非"1"的概率分布是负二项分布.

由于此方法在内部使用中间随机值调用 Generator.poisson ,因此当 \(n\)\(p\) 的选择导致采样的中间分布的平均值 + 10 sigma 超过 Generator.poisson 方法的最大可接受值时,会引发 ValueError.当 \(p\) 太低(每次成功发生很多失败)且 \(n\) 太大(允许有很多成功)时,会发生这种情况.因此, \(n\)\(p\) 值必须满足以下约束:

\[n\frac{1-p}{p}+10n\sqrt{n}\frac{1-p}{p}<2^{63}-1-10\sqrt{2^{63}-1},\]

其中,等式的左侧是从伽马分布中采样的样本的导出的平均值 + 10 sigma,该伽马分布在内部用作泊松样本的 \(lam\) 参数,等式的右侧是 Generator.poisson\(lam\) 最大值的约束.

参考文献

[1]

Weisstein, Eric W. “Negative Binomial Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.wolfram.com/NegativeBinomialDistribution.html

[2]

Wikipedia, “Negative binomial distribution”, https://en.wikipedia.org/wiki/Negative_binomial_distribution

示例

从分布中抽取样本:

一个真实世界的例子.一家公司钻探野猫式石油勘探井,每口井的估计成功概率为 0.1.对于每口连续的井,获得一次成功的概率是多少?也就是说,在钻探 5 口井后,6 口井后等等,获得一次成功的概率是多少?

>>> rng = np.random.default_rng()
>>> s = rng.negative_binomial(1, 0.1, 100000)
>>> for i in range(1, 11): 
...    probability = sum(s<i) / 100000.
...    print(i, "wells drilled, probability of one success =", probability)