Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

A Two-Stage Phase-Aware Approach for Monaural Multi-Talker Speech Separation Pendekatan Sedar Fasa Dua Peringkat untuk Pemisahan Pertuturan Monaural Multi-Talker

Lu YIN, Junfeng LI, Yonghong YAN, Masato AKAGI

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Sebutan serentak memberi kesan kepada keupayaan kedua-dua orang cacat pendengaran dan sistem pengecaman pertuturan automatik. Baru-baru ini, rangkaian saraf dalam telah meningkatkan prestasi pemisahan pertuturan secara mendadak. Walau bagaimanapun, kebanyakan karya terdahulu hanya menganggarkan magnitud pertuturan dan menggunakan fasa campuran untuk pembinaan semula pertuturan. Penggunaan fasa campuran telah menjadi had kritikal untuk prestasi pemisahan. Kajian ini mencadangkan pendekatan sedar fasa dua peringkat untuk pemisahan pertuturan berbilang penutur, yang secara bersepadu memulihkan magnitud serta fasa. Untuk pemulihan fasa, algoritma Penyongsangan Spektrogram Berbilang Input (MISI) digunakan kerana keberkesanan dan kesederhanaannya. Kajian itu melaksanakan algoritma MISI berdasarkan topeng dan memberikan topeng amplitud ideal (IAM) adalah topeng optimum untuk pemulihan fasa MISI berasaskan topeng, yang membawa kurang herotan fasa. Untuk mengimbangi ralat pemulihan fasa dan meminimumkan herotan isyarat, topeng lanjutan dicadangkan untuk anggaran magnitud. IAM dan topeng yang dicadangkan dianggarkan pada peringkat yang berbeza untuk memulihkan fasa dan magnitud, masing-masing. Dua rangka kerja rangkaian saraf dinilai untuk anggaran magnitud pada peringkat kedua, menunjukkan keberkesanan dan fleksibiliti pendekatan yang dicadangkan. Keputusan eksperimen menunjukkan bahawa pendekatan yang dicadangkan meminimumkan herotan pertuturan yang dipisahkan dengan ketara.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E103-D No.7 pp.1732-1743
Tarikh penerbitan
2020/07/01
Diumumkan
2020/04/20
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2019EDP7259
Jenis Manuskrip
PAPER
kategori
Pertuturan dan Pendengaran

Pengarang

Lu YIN
  University of Chinese Academy of Sciences,Chinese Academy of Sciences
Junfeng LI
  University of Chinese Academy of Sciences,Chinese Academy of Sciences
Yonghong YAN
  University of Chinese Academy of Sciences,Chinese Academy of Sciences
Masato AKAGI
  Japan Advanced Institute of Science and Technology

Kata kunci

Contents [show]