Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

SENTEI: Filter-Wise Pruning with Distillation towards Efficient Sparse Convolutional Neural Network Accelerators SENEI: Pemangkasan Bijak Penapis dengan Penyulingan ke arah Pemecut Rangkaian Neural Konvolusi Jarang yang Cekap

Masayuki SHIMODA, Youki SADA, Ryosuke KURAMOCHI, Shimpei SATO, Hiroki NAKAHARA

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Dalam merealisasikan rangkaian neural convolutional (CNN) dalam perkakasan terbenam yang dikekang sumber, jejak memori pemberat adalah salah satu masalah utama. Teknik pemangkasan sering digunakan untuk mengurangkan bilangan berat. Walau bagaimanapun, taburan pemberat bukan sifar adalah sangat condong, yang menjadikannya lebih sukar untuk menggunakan selari asas. Untuk menangani masalah ini, kami membentangkan SENTEI*, pemangkasan bijak penapis dengan penyulingan, untuk merealisasikan seni bina rangkaian sedar perkakasan dengan ketepatan yang setanding. Pemangkasan bijak penapis menghilangkan pemberat supaya setiap penapis mempunyai bilangan pemberat bukan sifar yang sama, dan latihan semula dengan penyulingan mengekalkan ketepatan. Selanjutnya, kami membangunkan pemecut saluran paip antara lapisan skipping berat sifar pada FPGA. Penyamaan membolehkan selari antara penapis, di mana blok pemprosesan untuk lapisan melaksanakan penapis serentak dengan seni bina mudah. Penilaian kami terhadap tugas pembahagian semantik menunjukkan bahawa mIoU yang terhasil hanya berkurangan sebanyak 0.4 mata. Selain itu, kelajuan dan kecekapan kuasa pelaksanaan FPGA kami adalah 33.2× dan 87.9× lebih tinggi daripada GPU mudah alih. Oleh itu, teknik kami merealisasikan rangkaian menyedari perkakasan dengan ketepatan yang setanding.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E103-D No.12 pp.2463-2470
Tarikh penerbitan
2020/12/01
Diumumkan
2020/08/03
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2020PAP0013
Jenis Manuskrip
Special Section PAPER (Special Section on Parallel, Distributed, and Reconfigurable Computing, and Networking)
kategori
Sistem komputer

Pengarang

Masayuki SHIMODA
  Tokyo Institute of Technology
Youki SADA
  Tokyo Institute of Technology
Ryosuke KURAMOCHI
  Tokyo Institute of Technology
Shimpei SATO
  Tokyo Institute of Technology
Hiroki NAKAHARA
  Tokyo Institute of Technology

Kata kunci

Contents [show]