numpy.random.Generator.negative_binomial#
method
- random.Generator.negative_binomial(n, p, size=None)#
从负二项分布中抽取样本.
样本从具有指定参数的负二项分布中抽取,参数为 n 次成功和 p 成功概率,其中 n > 0 且 p 在区间 (0, 1] 内.
- 参数:
- nfloat 或 float 的类数组
分布的参数,> 0.
- pfloat 或 float 的类数组
分布的参数.必须满足 0 < p <= 1.
- sizeint 或 int 元组,可选
输出形状.例如,如果给定的形状是
(m, n, k),则抽取m * n * k个样本.如果 size 是None(默认值),则当n和p都是标量时,返回单个值.否则,抽取np.broadcast(n, p).size个样本.
- 返回:
- outndarray 或标量
从参数化的负二项分布中抽取的样本,其中每个样本等于 N,即达到总共 n 次成功之前发生的失败次数.
注释
负二项分布的概率质量函数为
\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]其中 \(n\) 是成功的次数, \(p\) 是成功的概率, \(N+n\) 是试验的次数, \(\Gamma\) 是伽马函数. 当 \(n\) 是整数时, \(\frac{\Gamma(N+n)}{N!\Gamma(n)} = \binom{N+n-1}{N}\) ,这是 pmf 中此项的更常见形式. 负二项分布给出了在最后一次试验成功的情况下,给定 n 次成功时的 N 次失败的概率.
如果重复投掷骰子,直到第三次出现"1",那么在第三次"1"出现之前出现的非"1"的概率分布是负二项分布.
由于此方法在内部使用中间随机值调用
Generator.poisson,因此当 \(n\) 和 \(p\) 的选择导致采样的中间分布的平均值 + 10 sigma 超过Generator.poisson方法的最大可接受值时,会引发 ValueError.当 \(p\) 太低(每次成功发生很多失败)且 \(n\) 太大(允许有很多成功)时,会发生这种情况.因此, \(n\) 和 \(p\) 值必须满足以下约束:\[n\frac{1-p}{p}+10n\sqrt{n}\frac{1-p}{p}<2^{63}-1-10\sqrt{2^{63}-1},\]其中,等式的左侧是从伽马分布中采样的样本的导出的平均值 + 10 sigma,该伽马分布在内部用作泊松样本的 \(lam\) 参数,等式的右侧是
Generator.poisson中 \(lam\) 最大值的约束.参考文献
[1]Weisstein, Eric W. “Negative Binomial Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.wolfram.com/NegativeBinomialDistribution.html
[2]Wikipedia, “Negative binomial distribution”, https://en.wikipedia.org/wiki/Negative_binomial_distribution
示例
从分布中抽取样本:
一个真实世界的例子.一家公司钻探野猫式石油勘探井,每口井的估计成功概率为 0.1.对于每口连续的井,获得一次成功的概率是多少?也就是说,在钻探 5 口井后,6 口井后等等,获得一次成功的概率是多少?
>>> rng = np.random.default_rng() >>> s = rng.negative_binomial(1, 0.1, 100000) >>> for i in range(1, 11): ... probability = sum(s<i) / 100000. ... print(i, "wells drilled, probability of one success =", probability)