numpy.random.binomial#

random.binomial(n, p, size=None)#

从二项分布中抽取样本.

样本是从具有指定参数的二项分布中抽取的,n 次试验和 p 成功概率,其中 n 是 >= 0 的整数,p 在区间 [0,1] 中.(n 可以作为浮点数输入,但在使用时会被截断为整数)

备注

新代码应使用 binomial 方法,该方法是 Generator 实例的一个方法;请参阅 快速入门 .

参数:
nint 或 int 的类数组

分布的参数,>= 0.也接受浮点数,但它们将被截断为整数.

pfloat 或 float 的类数组

分布的参数,>= 0 且 <=1.

sizeint 或 int 元组,可选

输出形状.例如,如果给定的形状是 (m, n, k) ,则抽取 m * n * k 个样本.如果 size 是 None (默认值),则当 np 都是标量时,返回单个值.否则,抽取 np.broadcast(n, p).size 个样本.

返回:
outndarray 或标量

从参数化的二项分布中抽取的样本,其中每个样本等于 n 次试验中成功的次数.

参见

scipy.stats.binom

概率密度函数,分布或累积密度函数等.

random.Generator.binomial

新代码应该使用它.

注释

二项分布的概率质量函数 (PMF) 为

\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]

其中 \(n\) 是试验次数, \(p\) 是成功的概率, \(N\) 是成功的次数.

当使用随机样本估计总体中比例的标准误差时,正态分布效果很好,除非乘积 pn <=5,其中 p = 总体比例估计,n = 样本数,在这种情况下,应使用二项分布.例如,一个由 15 人组成的样本显示 4 人是左撇子,11 人是右撇子.那么 p = 4/15 = 27%.0.2715 = 4,因此在这种情况下应使用二项分布.

参考文献

[1]

Dalgaard, Peter, “Introductory Statistics with R”, Springer-Verlag, 2002.

[2]

Glantz, Stanton A. “Primer of Biostatistics.”, McGraw-Hill, Fifth Edition, 2002.

[3]

Lentner, Marvin, “Elementary Applied Statistics”, Bogden and Quigley, 1972.

[4]

Weisstein, Eric W. “Binomial Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.wolfram.com/BinomialDistribution.html

[5]

Wikipedia, “Binomial distribution”, https://en.wikipedia.org/wiki/Binomial_distribution

示例

从分布中抽取样本:

>>> n, p = 10, .5  # number of trials, probability of each trial
>>> s = np.random.binomial(n, p, 1000)
# result of flipping a coin 10 times, tested 1000 times.

一个现实世界的例子.一家公司钻探了 9 口野猫石油勘探井,每口井的估计成功概率为 0.1.所有九口井都失败了.发生这种情况的概率是多少?

让我们对该模型进行 20,000 次试验,并计算产生零个积极结果的试验次数.

>>> sum(np.random.binomial(9, 0.1, 20000) == 0)/20000.
# answer = 0.38885, or 38%.