Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Research on Lightweight Acoustic Scene Perception Method Based on Drunkard Methodology Penyelidikan Kaedah Persepsi Adegan Akustik Ringan Berdasarkan Metodologi Drunkard

Wenkai LIU, Lin ZHANG, Menglong WU, Xichang CAI, Hongxia DONG

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Matlamat Klasifikasi Adegan Akustik (ASC) adalah untuk mensimulasikan analisis manusia terhadap persekitaran sekeliling dan membuat keputusan yang tepat dengan segera. Mengekstrak maklumat berguna daripada isyarat audio dalam senario dunia sebenar adalah mencabar dan boleh membawa kepada prestasi suboptimum dalam klasifikasi pemandangan akustik, terutamanya dalam persekitaran dengan latar belakang yang agak homogen. Untuk menangani masalah ini, kami memodelkan proses menyedarkan "pemabuk" dalam kehidupan sebenar dan tingkah laku membimbing orang normal, dan membina metodologi pelaksanaan model ringan berketepatan tinggi yang dipanggil "metodologi pemabuk". Idea teras merangkumi tiga bahagian: (1) mereka bentuk modul transformasi ciri khas berdasarkan mekanisme persepsi maklumat yang berbeza antara pemabuk dan orang biasa, untuk mensimulasikan proses menyedarkan secara beransur-ansur dan perubahan dalam keupayaan persepsi ciri; (2) mengkaji model "mabuk" ringan yang sepadan dengan proses pemprosesan persepsi model biasa. Model ini menggunakan struktur blok sisa kelas berbilang skala dan boleh mendapatkan perwakilan ciri yang lebih halus dengan menggabungkan maklumat yang diekstrak pada skala yang berbeza; (3) memperkenalkan modul panduan dan gabungan model konvensional kepada model "mabuk" untuk mempercepatkan proses kesedaran dan mencapai pengoptimuman berulang dan peningkatan ketepatan. Keputusan penilaian pada set data rasmi DCASE2022 Task1 menunjukkan bahawa sistem garis dasar kami mencapai ketepatan 40.4% dan kehilangan 2.284 di bawah keadaan parameter 442.67K dan MAC 19.40M (operasi terkumpul berganda). Selepas menggunakan mekanisme "pemabuk", ketepatan dipertingkatkan kepada 45.2%, dan kerugian dikurangkan sebanyak 0.634 di bawah keadaan parameter 551.89K dan 23.6M MAC.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E107-D No.1 pp.83-92
Tarikh penerbitan
2024/01/01
Diumumkan
2023/10/23
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2023EDP7107
Jenis Manuskrip
PAPER
kategori
Kecerdasan Buatan, Perlombongan Data

Pengarang

Wenkai LIU
  North China University of Technology
Lin ZHANG
  North China University of Technology
Menglong WU
  North China University of Technology
Xichang CAI
  North China University of Technology
Hongxia DONG
  North China University of Technology

Kata kunci

Contents [show]