タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

hashingに関するchezouのブックマーク (3)

  • Distance Based Hashingによる多次元データのK近傍探索 - NO!と言えるようになりたい

    元ネタは Vassilis Athitsos, Michalis Potamias, Panagiotis Papapetrou, and George Kollios. Nearest Neighbor Retrieval Using Distance-Based Hashing. In ICDE, pp. 327–336. IEEE, 2008. Locally Sensitive Hashing(LSH) 多次元データのK近傍探索を行う場合に使われるのがLocally Sensitive Hashingである.同じく多次元データの探索技術として木構造の一つであるKD木を使ったものなどもある. をオブジェクトの空間とし,上で定義される距離測度をとする.また,となるハッシュ関数族をで表す.ただし,は整数全体の集合を意味する.いま,であるとき,全てのに対して, となる実数が存在する場合,

    Distance Based Hashingによる多次元データのK近傍探索 - NO!と言えるようになりたい
  • K-means hashing (CVPR'13) とハッシング周り

    2. 背景 • 画像特徴 – SIFT: 128次元, GIST: 960 (384) 次元, FV/VLAD: ~数万次元 – 1M~1B枚レベルの画像検索とかしたいお… – でも画像の特徴ベクトルそのものを利用すると メモリに乗らないし類似検索もおそいお… – だからコンパクトなバイナリコードに変換するお!(テンプレ) (面白いけど応用を気にしている人があんまいない印象) • バイナリ化のメリット – コンパクト+高速検索 (e.g., SSE 4.2 POPCNT) (参考)ビットを数える http://www.slideshare.net/takesako/x86x64-sse42-popcnt • 単純にユークリッド距離を近似することが目的の手法と supervisedでクラス分類を意識し距離学習も行う手法がある 3. Hashing "Similarity search in

    K-means hashing (CVPR'13) とハッシング周り
  • 最近のバイナリハッシングをいくつかJavaで実装してみた - rubyu's blog

    去年の終わりから、バイナリハッシングを使った近似近傍検索をいろいろ調べていたのですが、ぼちぼち一段落したので、ひと通りまとめておきます。 バイナリハッシングとは。 個の 次元の点からなるデータセット で、元空間での近傍点を、類似したバイナリコードに関連づける技術。 要するに、実数ベクトルの検索をマトモにやるには、最近のデータは膨大すぎるのでお手上げ。なので、元空間での距離をなるべく保ったまま、バイナリコードに落としましょう。 そうすると、バイナリ一致か、1ビット違うか、2ビット違うか...と、捜索していくにしても、元空間のデータでやるより高速で、しかもストレージ容量を削減できるというわけです。 その ビットのバイナリコード を作るために、 個のハッシュ関数が使われる。 ハッシュ関数は と定義される。ここで、 はデータセット。 は射影ベクトル。 は閾値。 線形写像ベースのハッシングはシンプル

    最近のバイナリハッシングをいくつかJavaで実装してみた - rubyu's blog
  • 1