numpy.random.Generator.negative_binomial#

method

random.Generator.negative_binomial(n, p, size=None)#

从负二项分布中抽取 samples.

Samples are drawn from a negative binomial distribution with specified parameters, n successes and p probability of success where n is > 0 and p is in the interval (0, 1].

参数:
nfloat 或 floats 的类数组对象

分布的参数,> 0.

pfloat 或 floats 的类数组对象

分布的参数.必须满足 0 < p <= 1.

sizeint 或 int 的元组,可选.

输出形状.如果给定形状是,例如, (m, n, k) ,则抽取 m * n * k 个样本.如果 sizeNone (默认),如果 np 都是标量,则返回单个值.否则,抽取 np.broadcast(n, p).size 个样本.

返回:
outndarray 或标量

从参数化的负二项分布中抽取的样本,其中每个样本等于 N,即在达到总共 n 次成功之前发生的失败次数.

注释

负二项分布的概率质量函数为

\[P(N;n,p) = \frac{\Gamma(N+n)}{N!\Gamma(n)}p^{n}(1-p)^{N},\]

其中 \(n\) 是 success 的次数, \(p\) 是 success 的概率, \(N+n\) 是试验次数, \(\Gamma\) 是 gamma 函数.当 \(n\) 是一个整数时, \(\frac{\Gamma(N+n)}{N!\Gamma(n)} = \binom{N+n-1}{N}\) ,这是 pmf 中该项的更常见形式.负二项分布给出了在最后一次试验中成功的情况下,给定 n 次成功时,N 次失败的概率.

如果一个人反复掷骰子,直到第三次出现“1”,那么在第三个“1”出现之前出现的非“1”的数量的概率分布就是一个负二项分布.

因为此方法在内部使用带有中间随机值的 Generator.poisson ,所以当 \(n\)\(p\) 的选择会导致采样的中间分布的平均值 + 10 个 sigma 超过 Generator.poisson 方法的最大可接受值时,会引发 ValueError.当 \(p\) 太低(每次成功发生很多失败)并且 \(n\) 太大(允许很多成功)时,会发生这种情况.因此, \(n\)\(p\) 值必须满足以下约束:

\[n\frac{1-p}{p}+10n\sqrt{n}\frac{1-p}{p}<2^{63}-1-10\sqrt{2^{63}-1},\]

其中,等式左侧是从伽马分布(在内部用作泊松样本的 \(lam\) 参数)导出的平均值 + 10 倍标准差,等式右侧是 Generator.poisson\(lam\) 最大值的约束.

参考

[1]

Weisstein, Eric W. “负二项分布.” 来自 MathWorld–Wolfram Web 资源. https://mathworld.wolfram.com/NegativeBinomialDistribution.html

[2]

Wikipedia, “负二项分布”, https://en.wikipedia.org/wiki/Negative_binomial_distribution

示例

从分布中抽取样本:

一个真实的例子.一家公司钻探野猫油勘探井,每口井的估计成功概率为 0.1.对于连续的每口井,获得一次成功的概率是多少?也就是,在钻探 5 口井后,6 口井后等等,获得一次成功的概率是多少?

>>> rng = np.random.default_rng()
>>> s = rng.negative_binomial(1, 0.1, 100000)
>>> for i in range(1, 11): 
...    probability = sum(s<i) / 100000.
...    print(i, "wells drilled, probability of one success =", probability)