查找一个数组与另一个数组中所有值的最接近索引-Python / NumPy

这是一种np.searchsorted基于this post-的矢量化方法

def closest_argmin(A, B):
    L = B.size
    sidx_B = B.argsort()
    sorted_B = B[sidx_B]
    sorted_idx = np.searchsorted(sorted_B, A)
    sorted_idx[sorted_idx==L] = L-1
    mask = (sorted_idx > 0) & \
    ((np.abs(A - sorted_B[sorted_idx-1]) < np.abs(A - sorted_B[sorted_idx])) )
    return sidx_B[sorted_idx-mask]

简要说明：

获取左位置的排序索引。我们使用-np.searchsorted(arr1, arr2, side='left')或just进行此操作np.searchsorted(arr1, arr2)。现在，searchsorted期望将排序数组作为第一个输入，因此我们需要在那里做一些准备工作。

比较那些左侧位置的值和其紧邻右侧位置的值，(left + 1)看看哪一个最接近。我们在计算的步骤中执行此操作mask。

根据左边的还是最右边的，选择相应的。这是通过对索引进行减法来完成的，将mask值作为偏移量转换为ints。

原始方法-

def org_app(myArray, refArray):
    out1 = np.empty(myArray.size, dtype=int)
    for i, value in enumerate(myArray):
        # find_nearest from posted question
        index = find_nearest(refArray, value)
        out1[i] = index
    return out1

时间和验证-

In [188]: refArray = np.random.random(16)
     ...: myArray = np.random.random(1000)
     ...:

In [189]: %timeit org_app(myArray, refArray)
100 loops, best of 3: 1.95 ms per loop

In [190]: %timeit closest_argmin(myArray, refArray)
10000 loops, best of 3: 36.6 µs per loop

In [191]: np.allclose(closest_argmin(myArray, refArray), org_app(myArray, refArray))
Out[191]: True

加快发布的样本的速度，希望对更大的数据集有更多的速度！

python 2022/1/1 18:33:09 有213人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

如何在C＃/。NET中查找本地计算机的FQDN？

如何在C＃/。NET中查找本地计算机的FQDN？

c# 2022-01-01 1120
Mongodb，查找集合是否为空，node.js

Mongodb，查找集合是否为空，node.js

mongodb 2022-01-01 1032
查找向量之间的符号角

查找向量之间的符号角

其他 2022-01-01 755
C＃查找最高的数组值和索引

C＃查找最高的数组值和索引

c# 2022-01-01 884
如何使用Golang在SQL中执行IN查找？

如何使用Golang在SQL中执行IN查找？

SQLServer 2022-01-01 900
opencv用于查找轮廓的算法是什么？

opencv用于查找轮廓的算法是什么？

其他 2022-01-01 861
查找没有jQuery的最接近元素

查找没有jQuery的最接近元素

JS 2022-01-01 903
使用jpql查找具有包含给定集合的所有元素的集合的项目

使用jpql查找具有包含给定集合的所有元素的集合的项目

其他 2022-01-01 901
在目录中查找最旧的文件（递归）

在目录中查找最旧的文件（递归）

其他 2022-01-01 791
如何查找搜索/查找npm软件包

如何查找搜索/查找npm软件包

其他 2022-01-01 720
将嵌入式Tomcat从v6更改为v7会导致InitialContext查找失败

将嵌入式Tomcat从v6更改为v7会导致InitialContext查找失败

其他 2022-01-01 723
查找数组中长度为k的所有子集

查找数组中长度为k的所有子集

其他 2022-01-01 704
查找任何文件编码的有效方法

查找任何文件编码的有效方法

其他 2022-01-01 753
如何使用JPA和Spring在列表中查找具有字段的不同行？

如何使用JPA和Spring在列表中查找具有字段的不同行？

Java 2022-01-01 813
查找第一个可滚动的父级

查找第一个可滚动的父级

其他 2022-01-01 769
查找给定半径内的所有整数坐标

查找给定半径内的所有整数坐标

其他 2022-01-01 749
查找两个纬度/经度点之间距离的最快方法

查找两个纬度/经度点之间距离的最快方法

其他 2022-01-01 853
查找多个JavaScript数组之间的匹配项

查找多个JavaScript数组之间的匹配项

javascript 2022-01-01 715
在（解析）树的集合中查找最频繁的子树

在（解析）树的集合中查找最频繁的子树

其他 2022-01-01 868
如何从其String值查找Java枚举？

如何从其String值查找Java枚举？

java 2022-01-01 705

查找一个数组与另一个数组中所有值的最接近索引-Python / NumPy

撰写回答

推荐问题

如何在C＃/。NET中查找本地计算机的FQDN？

Mongodb，查找集合是否为空，node.js

查找向量之间的符号角

C＃查找最高的数组值和索引

如何使用Golang在SQL中执行IN查找？

opencv用于查找轮廓的算法是什么？

查找没有jQuery的最接近元素

使用jpql查找具有包含给定集合的所有元素的集合的项目

在目录中查找最旧的文件（递归）

如何查找搜索/查找npm软件包

将嵌入式Tomcat从v6更改为v7会导致InitialContext查找失败

查找数组中长度为k的所有子集

查找任何文件编码的有效方法

如何使用JPA和Spring在列表中查找具有字段的不同行？

查找第一个可滚动的父级

查找给定半径内的所有整数坐标

查找两个纬度/经度点之间距离的最快方法

查找多个JavaScript数组之间的匹配项

在（解析）树的集合中查找最频繁的子树

如何从其String值查找Java枚举？

分类汇总

您的鼓励是对我最大的支持