Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Approximate Nearest Neighbor Search for a Dataset of Normalized Vectors Anggaran Carian Jiran Terdekat untuk Set Data Vektor Ternormal

Kengo TERASAWA, Yuzuru TANAKA

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Makalah ini menerangkan algoritma baru untuk anggaran carian jiran terdekat. Untuk menyelesaikan masalah ini terutamanya dalam ruang dimensi tinggi, salah satu algoritma yang paling terkenal ialah Locality-Sensitive Hashing (LSH). Makalah ini membentangkan varian algoritma LSH yang mengatasi kaedah yang dicadangkan sebelum ini apabila set data terdiri daripada vektor yang dinormalkan kepada panjang unit, yang selalunya berlaku dalam pengecaman corak. Skim LSH adalah berdasarkan keluarga fungsi cincang yang mengekalkan lokaliti mata. Makalah ini menunjukkan bahawa untuk masalah kes khas kami, kami boleh mereka bentuk fungsi cincang yang cekap yang memetakan titik pada hipersfera ke puncak terdekat politop biasa yang diputar secara rawak. Analisis pengiraan mengesahkan bahawa kaedah yang dicadangkan boleh meningkatkan eksponen ρ, penunjuk utama prestasi algoritma LSH. Eksperimen praktikal juga menyokong kecekapan algoritma kami dalam masa dan dalam ruang.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E92-D No.9 pp.1609-1619
Tarikh penerbitan
2009/09/01
Diumumkan
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.E92.D.1609
Jenis Manuskrip
PAPER
kategori
Teori Algoritma

Pengarang

Kata kunci

Contents [show]