numpy.in1d#
- numpy.in1d(ar1, ar2, assume_unique=False, invert=False, *, kind=None)[源代码]#
测试 1-D 数组的每个元素是否也存在于第二个数组中.
返回一个与 ar1 长度相同的布尔数组,其中 ar1 的元素在 ar2 中时为 True,否则为 False.
- 参数:
- ar1(M,) array_like
输入数组.
- ar2array_like
用于测试 ar1 的每个值的值.
- assume_uniquebool,可选
如果为 True,则假定输入数组都是唯一的,这可以加快计算速度.默认为 False.
- invertbool,可选
如果为 True,则返回的数组中的值会反转(即,如果 ar1 的元素在 ar2 中,则为 False,否则为 True).默认为 False.
np.in1d(a, b, invert=True)等效于(但比)的np.invert(in1d(a, b))速度更快.- kind{None, ‘sort’, ‘table’}, optional
要使用的算法.这不会影响最终结果,但会影响速度和内存使用. 默认值 None 将根据内存考虑因素自动选择.
如果为’sort’,将使用基于归并排序的方法. 这将占用大约 6 倍的 ar1 和 ar2 大小之和的内存,不包括 dtype 的大小.
如果为’table’,将使用类似于计数排序的查找表方法. 这仅适用于布尔和整数数组. 这将占用 ar1 的大小加上 ar2 的 max-min 值大小的内存. 当使用’table’选项时, assume_unique 无效.
如果为 None,则会自动选择"table",如果所需的内存分配小于或等于 ar1 和 ar2 大小之和的 6 倍,否则将使用"sort". 这样做是为了默认情况下不使用大量内存,即使在大多数情况下 "table" 可能更快. 如果选择了"table",则 assume_unique 将不起作用.
- 返回:
- in1d(M,) ndarray, bool
值 ar1[in1d] 在 ar2 中.
参见
isin此函数的版本,保留 ar1 的形状.
注释
in1d可以被认为是 python 关键字 in 的元素方式函数版本,用于 1-D 序列.in1d(a, b)大致等效于np.array([item in b for item in a]). 但是,如果 ar2 是集合或类似容器(非序列),则此想法将失败:由于ar2被转换为数组,因此在这些情况下asarray(ar2)是一个对象数组,而不是预期的包含值数组.如果以下关系成立,则使用
kind='table'往往比 kind=’sort’ 更快:log10(len(ar2)) > (log10(max(ar2)-min(ar2)) - 2.27) / 0.927,但可能会使用更大的内存. kind 的默认值将仅基于内存使用情况自动选择,因此如果可以放宽内存限制,则可以手动设置kind='table'.示例
>>> import numpy as np >>> test = np.array([0, 1, 2, 5, 0]) >>> states = [0, 2] >>> mask = np.in1d(test, states) >>> mask array([ True, False, True, False, True]) >>> test[mask] array([0, 2, 0]) >>> mask = np.in1d(test, states, invert=True) >>> mask array([False, True, False, True, False]) >>> test[mask] array([1, 5])