numpy.random.RandomState.binomial#
method
- random.RandomState.binomial(n, p, size=None)#
从二项分布中抽取样本.
样本是从具有指定参数的二项分布中抽取的, n 次试验, p 成功的概率, 其中 n 是一个 >= 0 的整数, p 在区间 [0,1] 中.(n 可以作为浮点数输入, 但在使用中它会被截断为整数)
- 参数:
- nint 或 ints 的类数组对象
分布的参数, >= 0.也接受浮点数, 但它们将被截断为整数.
- pfloat 或 floats 的类数组对象
分布的参数, >= 0 且 <= 1.
- sizeint 或 int 的元组,可选.
输出形状.如果给定形状是,例如,
(m, n, k),则抽取m * n * k个样本.如果 size 是None(默认),如果n和p都是标量,则返回单个值.否则,抽取np.broadcast(n, p).size个样本.
- 返回:
- outndarray 或标量
从参数化的二项分布中抽取的样本, 其中每个样本等于 n 次试验中成功的次数.
参见
scipy.stats.binom概率密度函数,分布或累积密度函数等.
random.Generator.binomial新代码应该使用这个.
注释
二项分布的概率质量函数 (PMF) 为
\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]其中 \(n\) 是试验次数, \(p\) 是成功的概率, \(N\) 是成功的次数.
当使用随机样本估计总体中的比例的标准误差时,除非乘积 pn <=5,否则正态分布效果很好,其中 p = 总体比例估计,n = 样本数,在这种情况下,使用二项分布代替.例如,一个 15 人的样本显示 4 个是左撇子,11 个是右撇子.那么 p = 4/15 = 27%.0.2715 = 4,所以这种情况下应该使用二项分布.
参考
[1]Dalgaard, Peter, “Introductory Statistics with R”, Springer-Verlag, 2002.
[2]Glantz, Stanton A. “Primer of Biostatistics.”, McGraw-Hill, Fifth Edition, 2002.
[3]Lentner, Marvin, “Elementary Applied Statistics”, Bogden and Quigley, 1972.
[4]Weisstein, Eric W. “Binomial Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.wolfram.com/BinomialDistribution.html
[5]Wikipedia, “Binomial distribution”, https://en.wikipedia.org/wiki/Binomial_distribution
示例
从分布中抽取样本:
>>> n, p = 10, .5 # number of trials, probability of each trial >>> s = np.random.binomial(n, p, 1000) # result of flipping a coin 10 times, tested 1000 times.
一个现实世界的例子.一家公司钻探了 9 口野猫式石油勘探井,每口井的估计成功概率为 0.1.所有九口井都失败了. 发生这种情况的概率是多少?
让我们对模型进行 20,000 次试验,并计算产生零阳性结果的次数.
>>> sum(np.random.binomial(9, 0.1, 20000) == 0)/20000. # answer = 0.38885, or 38%.