Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Simple Black-Box Adversarial Examples Generation with Very Few Queries Penjanaan Contoh Pemusuhan Kotak Hitam Mudah dengan Sangat Sedikit Pertanyaan

Yuya SENZAKI, Satsuya OHATA, Kanta MATSUURA

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Penyelidikan tentang contoh musuh untuk pembelajaran mesin telah mendapat banyak perhatian dalam beberapa tahun kebelakangan ini. Kebanyakan pendekatan sebelumnya adalah serangan kotak putih; ini bermakna penyerang perlu mendapatkan parameter dalaman terlebih dahulu bagi pengelas sasaran untuk menjana contoh lawan untuknya. Keadaan ini sukar untuk dipenuhi dalam amalan. Terdapat juga penyelidikan mengenai serangan kotak hitam, di mana penyerang hanya boleh mendapatkan maklumat separa tentang pengelas sasaran; walau bagaimanapun, nampaknya kita boleh menghalang serangan ini, kerana mereka perlu mengeluarkan banyak pertanyaan yang mencurigakan kepada pengelas sasaran. Dalam makalah ini, kami menunjukkan bahawa strategi pertahanan naif berdasarkan pengawasan pertanyaan nombor tidak akan mencukupi. Lebih konkrit, kami mencadangkan untuk menjana gangguan permusuhan bukan dari segi piksel tetapi dari segi blok untuk mengurangkan bilangan pertanyaan. Eksperimen kami menunjukkan bahawa gangguan kasar sedemikian boleh mengelirukan pengelas sasaran. Kami berjaya mengurangkan bilangan pertanyaan untuk menjana contoh lawan dalam kebanyakan kes. Kaedah mudah kami ialah serangan tidak disasarkan dan mungkin mempunyai kadar kejayaan yang rendah berbanding dengan keputusan sebelumnya bagi serangan kotak hitam yang lain, tetapi memerlukan lebih sedikit pertanyaan dalam purata. Yang menghairankan, bilangan pertanyaan minimum (masing-masing satu dan tiga dalam set data MNIST dan CIFAR-10) sudah cukup untuk menjana contoh lawan dalam beberapa kes. Selain itu, berdasarkan keputusan ini, kami mencadangkan klasifikasi terperinci untuk penyerang kotak hitam dan membincangkan langkah balas terhadap serangan di atas.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E103-D No.2 pp.212-221
Tarikh penerbitan
2020/02/01
Diumumkan
2019/10/02
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2019INP0002
Jenis Manuskrip
Special Section PAPER (Special Section on Security, Privacy, Anonymity and Trust in Cyberspace Computing and Communications)
kategori
Kebolehpercayaan dan Keselamatan Sistem Komputer

Pengarang

Yuya SENZAKI
  Idein Inc.
Satsuya OHATA
  National Institute of Advanced Industrial Science and Technology (AIST)
Kanta MATSUURA
  The University of Tokyo

Kata kunci

Contents [show]