Nmslib高维空间最近邻逼近搜索算法介绍

  • 时间:
  • 浏览:0
  • 来源:uu快3规律_uu快3下载地址_窍门

越来越等你算完,使用者的心就哇凉哇凉的,越来越耐心等候的,而使用淘宝拍立淘的完后 ,响应波特率非常快,用户体验很好!

本身完后 就可然后 考虑使用本身快速计算的方式——ANN。

项目地址:https://github.com/nmslib/nmslib

非度量空间库(NMSLIB)是本身高效的跨平台类似于性搜索库和用于评估类似于性搜索方式的工具包。核心库并越来越任何第三方依赖。

NMSLIB是另另一个 可扩展的库,这导致 可然后 换成新的搜索方式和距离函数。NMSLIB可然后 直接在C ++和Python中使用。此外,可然后 构建另另一个 查询服务器,可然后 从Java(或Apache Thrift支持的本身语言)中使用。

这里介绍python的使用方式。

上一次介绍图像搜索的基本原理,现在记录下使用的数据包的什么的什么的问题。

查询图片先进行结构提取,使用另另一个 向量来表示,完后 使用该向量与数据库中所有的商品向量进行计算类似于度指标,比如cos距离,欧式距离,汉明距离。

具体的取决于向量的形式,有的先用cnn提取结构向量,可然后 计算其cos距离,有的提取完后 对其进行哈希编码,先用汉明距离进行粗排,完后 按照欧式距离进行重排。

这里就面临完后 的另另一个 什么的什么的问题:

上述代码就是 我片段,全部讲解下各个参数的设置

一看了ANN,第一反应应该是人工神经网络,这里是Approximate Nearest Neighbor,近似邻居算法。

关于这方面的算法有就是 ,比如Annoyscikit-learnhnswlib, nmslib等等。

几乎所有的ANN方式不是对全空间的划分,大多数使用的树模型,全部的介绍可然后 上网查询一下,这里介绍我人个所有使用过的nmslib包讲解。

关于参数的设置可然后 见