numpy.random.lognormal#

random.lognormal(mean=0.0, sigma=1.0, size=None)#

从对数正态分布中抽取样本.

从具有指定均值,标准差和数组形状的对数正态分布中抽取样本.请注意,均值和标准差不是分布本身的值,而是其导出的底层正态分布的值.

备注

新代码应该使用 lognormal 方法,该方法是 Generator 实例的一个方法;请参见 快速入门 .

参数:
meanfloat 或 float 的类数组,可选

底层正态分布的均值.默认值为 0.

sigmafloat 或 float 的类数组,可选

底层正态分布的标准差.必须是非负数.默认值为 1.

sizeint 或 int 的元组,可选.

输出形状.如果给定的形状是例如 (m, n, k) ,则抽取 m * n * k 个样本.如果 size 是 None (默认值),如果 meansigma 都是标量,则返回单个值. 否则,抽取 np.broadcast(mean, sigma).size 个样本.

返回:
outndarray 或标量

从参数化的对数正态分布中抽取的样本.

参见

scipy.stats.lognorm

概率密度函数,分布,累积密度函数等.

random.Generator.lognormal

新代码应该使用这个.

注释

如果 log(x) 是正态分布,则变量 x 具有对数正态分布.对数正态分布的概率密度函数为:

\[p(x) = \frac{1}{\sigma x \sqrt{2\pi}} e^{(-\frac{(ln(x)-\mu)^2}{2\sigma^2})}\]

其中 \(\mu\) 是变量正态分布对数的均值, \(\sigma\) 是标准差.如果一个随机变量是大量独立同分布变量的乘积,那么就会产生一个对数正态分布,这与一个变量是大量独立同分布变量的和时会产生正态分布的方式相同.

参考

[1]

Limpert, E., Stahel, W. A., 和 Abbt, M., “Log-normal Distributions across the Sciences: Keys and Clues,” BioScience, Vol. 51, No. 5, May, 2001. https://stat.ethz.ch/~stahel/lognormal/bioscience.pdf

[2]

Reiss, R.D. 和 Thomas, M., “Statistical Analysis of Extreme Values,” Basel: Birkhauser Verlag, 2001, pp. 31-32.

示例

从分布中抽取样本:

>>> mu, sigma = 3., 1. # mean and standard deviation
>>> s = np.random.lognormal(mu, sigma, 1000)

显示样本的直方图,以及概率密度函数:

>>> import matplotlib.pyplot as plt
>>> count, bins, ignored = plt.hist(s, 100, density=True, align='mid')
>>> x = np.linspace(min(bins), max(bins), 10000)
>>> pdf = (np.exp(-(np.log(x) - mu)**2 / (2 * sigma**2))
...        / (x * sigma * np.sqrt(2 * np.pi)))
>>> plt.plot(x, pdf, linewidth=2, color='r')
>>> plt.axis('tight')
>>> plt.show()
../../../_images/numpy-random-lognormal-1_00_00.png

论证从均匀分布中获取的随机样本的乘积,可以用对数正态概率密度函数很好地拟合.

>>> # Generate a thousand samples: each is the product of 100 random
>>> # values, drawn from a normal distribution.
>>> b = []
>>> for i in range(1000):
...    a = 10. + np.random.standard_normal(100)
...    b.append(np.prod(a))
>>> b = np.array(b) / np.min(b) # scale values to be positive
>>> count, bins, ignored = plt.hist(b, 100, density=True, align='mid')
>>> sigma = np.std(np.log(b))
>>> mu = np.mean(np.log(b))
>>> x = np.linspace(min(bins), max(bins), 10000)
>>> pdf = (np.exp(-(np.log(x) - mu)**2 / (2 * sigma**2))
...        / (x * sigma * np.sqrt(2 * np.pi)))
>>> plt.plot(x, pdf, color='r', linewidth=2)
>>> plt.show()
../../../_images/numpy-random-lognormal-1_01_00.png