Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Low-Complexity and Accurate Noise Suppression Based on an a Priori SNR Model for Robust Speech Recognition on Embedded Systems and Its Evaluation in a Car Environment Kerumitan Rendah dan Penindasan Bunyi Tepat Berdasarkan Model SNR Priori untuk Pengecaman Pertuturan Teguh pada Sistem Terbenam dan Penilaiannya dalam Persekitaran Kereta

Masanori TSUJIKAWA, Yoshinobu KAJIKAWA

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Dalam kertas kerja ini, kami mencadangkan penindasan hingar yang kerumitan rendah dan tepat berdasarkan model SNR (Nisbah Pertuturan kepada Bunyi) apriori untuk keteguhan yang lebih besar wrt turun naik hingar jangka pendek. SNR a priori, nisbah spektrum pertuturan dan spektrum hingar dalam domain spektrum, mewakili perbezaan antara ciri pertuturan dan ciri hingar dalam domain ciri, termasuk domain mel-cepstral dan domain spektrum kuasa logaritma. Ini kerana operasi logaritma digunakan untuk penukaran domain. Oleh itu, model SNR a priori dengan mudah boleh dinyatakan dari segi perbezaan antara model pertuturan dan model hingar, yang dimodelkan oleh model campuran Gaussian, dan ia boleh dijana dengan kos pengiraan yang rendah. Dengan menggunakan SNR priori yang dianggarkan dengan tepat berdasarkan model SNR a priori, adalah mungkin untuk mengira pekali tepat penapis penindasan hingar dengan mengambil kira varians hingar, tanpa peningkatan serius dalam kos pengiraan berbanding kos berasaskan model konvensional. Penapis Wiener (MBW). Kami telah menjalankan penilaian pengecaman pertuturan dalam kereta menggunakan pangkalan data CENSREC-2, dan perbandingan kaedah yang dicadangkan dengan MBW konvensional menunjukkan bahawa kadar ralat pengecaman untuk semua persekitaran hingar telah dikurangkan sebanyak 9%, dan itu, terutamanya, untuk persekitaran bunyi bunyi dikurangkan sebanyak 11%. Kami menunjukkan bahawa kaedah yang dicadangkan boleh diproses dengan tahap sumber pengiraan dan ingatan yang rendah melalui pelaksanaan pada pemproses isyarat digital.

Jawatankuasa
IEICE TRANSACTIONS on Fundamentals Vol.E106-A No.9 pp.1224-1233
Tarikh penerbitan
2023/09/01
Diumumkan
2023/02/28
ISSN dalam talian
1745-1337
DOI
10.1587/transfun.2022EAP1130
Jenis Manuskrip
PAPER
kategori
Pemprosesan Isyarat Digital

Pengarang

Masanori TSUJIKAWA
  Kansai University,NEC Corporation
Yoshinobu KAJIKAWA
  Kansai University

Kata kunci

Contents [show]