numpy.histogramdd#

numpy.histogramdd(sample, bins=10, range=None, density=None, weights=None)[源代码]#

计算一些数据的多维直方图.

参数:
sample(N, D) 数组,或 (N, D) 类数组

要统计直方图的数据.

注意当 sample 是类数组时,其非同寻常的解释:

  • 当 sample 是数组时,每行都是 D 维空间中的坐标 - 例如 histogramdd(np.array([p1, p2, p3])) .

  • 当 sample 是类数组时,每个元素是单个坐标的值列表 - 例如 histogramdd((X, Y, Z)) .

应该优先使用第一种形式.

bins序列或整数,可选

bin 的规范:

  • 描述沿每个维度单调递增的 bin 边缘的数组序列.

  • 每个维度的 bin 的数量 (nx, ny, … =bins)

  • 所有维度的 bin 的数量 (nx=ny=…=bins).

rangesequence, optional

长度为 D 的序列,每个序列都是一个可选的 (lower, upper) 元组,给出要使用的外部 bin 边缘(如果在 bins 中没有显式给出边缘).序列中的 None 条目会导致将最小值和最大值用于相应的维度.默认值 None 等效于传递 D 个 None 值的元组.

densitybool,可选

如果为 False(默认值),则返回每个 bin 中的样本数.如果为 True,则返回 bin 处的概率密度函数, bin_count / sample_count / bin_volume .

weights(N,) 类数组,可选

一个值数组 w_i ,用于衡量每个样本 (x_i, y_i, z_i, …) .如果 density 为 True,则权重归一化为 1.如果 density 为 False,则返回的直方图的值等于属于落入每个 bin 的样本的权重的总和.

返回:
Hndarray

样本 x 的多维直方图.有关不同的可能语义,请参见 density 和 weights.

edgesndarray 元组

描述每个维度 bin 边缘的 D 个数组的元组.

参见

histogram

1-D 直方图

histogram2d

2-D 直方图

示例

>>> import numpy as np
>>> rng = np.random.default_rng()
>>> r = rng.normal(size=(100,3))
>>> H, edges = np.histogramdd(r, bins = (5, 8, 4))
>>> H.shape, edges[0].size, edges[1].size, edges[2].size
((5, 8, 4), 6, 9, 5)