numpy.partition#

numpy.partition(a, kth, axis=-1, kind='introselect', order=None)[源代码]#

返回数组的划分副本.

创建数组的副本并对其进行部分排序,使得第 k 个位置的元素的值位于排序数组中的位置.在输出数组中,所有小于第 k 个元素的元素都位于该元素的左侧,所有相等或更大的元素都位于其右侧.输出数组中第 k 个元素两侧的两个分区中元素的顺序未定义.

参数:
aarray_like

要排序的数组.

kthint 或 int 序列

用于分区的元素索引.元素的第k个值将位于其最终排序位置,所有较小的元素将移动到其前面,所有相等或更大的元素将移动到其后面.分区中所有元素的顺序未定义.如果提供了k个值的序列,它将立即将所有由k个值索引的元素分区到其排序位置.

自 1.22.0 版本弃用: 将布尔值作为索引已弃用.

axisint 或 None,可选

沿其排序的轴.如果为 None,则在排序之前将数组展平.默认值为 -1,它沿最后一个轴排序.

kind{‘introselect’},可选

选择算法.默认为“introselect”.

orderstr 或 str 列表,可选

a 是一个定义了字段的数组时,此参数指定首先比较哪些字段,然后比较哪些字段,等等.单个字段可以指定为字符串.并非所有字段都需要指定,但未指定的字段仍将按照它们在 dtype 中出现的顺序使用,以打破平局.

返回:
partitioned_arrayndarray

a 具有相同类型和形状的数组.

参见

ndarray.partition

就地排序数组的方法.

argpartition

间接分区.

sort

完整排序

注释

各种选择算法的特点是它们的平均速度,最坏情况性能,工作空间大小以及它们是否稳定.稳定排序使具有相同键的项目保持相同的相对顺序.可用的算法具有以下属性:

kind

speed

worst case

work space

stable

‘introselect’

1

O(n)

0

当沿着除最后一个轴之外的任何轴进行分区时,所有分区算法都会创建数据的临时副本.因此,沿着最后一个轴进行分区比沿着任何其他轴进行分区更快,并且使用的空间更少.

复数的排序顺序是词典顺序.如果实部和虚部都不是nan,则顺序由实部决定,除非它们相等,在这种情况下,顺序由虚部决定.

np.nan 的排序顺序大于 np.inf .

示例

>>> import numpy as np
>>> a = np.array([7, 1, 7, 7, 1, 5, 7, 2, 3, 2, 6, 2, 3, 0])
>>> p = np.partition(a, 4)
>>> p
array([0, 1, 2, 1, 2, 5, 2, 3, 3, 6, 7, 7, 7, 7]) # may vary

p[4] 是 2; p[:4] 中的所有元素都小于或等于 p[4] , 并且 p[5:] 中的所有元素都大于或等于 p[4] .分区是:

[0, 1, 2, 1], [2], [5, 2, 3, 3, 6, 7, 7, 7, 7]

下一个示例显示了传递给 kth 的多个值的使用.

>>> p2 = np.partition(a, (4, 8))
>>> p2
array([0, 1, 2, 1, 2, 3, 3, 2, 5, 6, 7, 7, 7, 7])

p2[4] 是 2, p2[8] 是 5. p2[:4] 中的所有元素都小于或等于 p2[4] , p2[5:8] 中的所有元素都大于或等于 p2[4] 且小于或等于 p2[8] ,并且 p2[9:] 中的所有元素都大于或等于 p2[8] .分区是:

[0, 1, 2, 1], [2], [3, 3, 2], [5], [6, 7, 7, 7, 7]