Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Continuous Noise Masking Based Vocoder for Statistical Parametric Speech Synthesis Vokoder Berasaskan Noise Masking Berterusan untuk Sintesis Pertuturan Parametrik Statistik

Mohammed Salah AL-RADHI, Tamás Gábor CSAPÓ, Géza NÉMETH

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Dalam artikel ini, kami mencadangkan kaedah yang dipanggil "penopeng hingar berterusan (cNM)" yang membolehkan menghapuskan sisa buzziness dalam vocoder berterusan, iaitu semua parameter adalah berterusan dan menawarkan analisis pertuturan dan sistem sintesis yang mudah dan fleksibel. Vokoder parametrik tradisional secara amnya menunjukkan kemerosotan yang ketara dalam kualiti pertuturan yang disintesis disebabkan oleh algoritma pemprosesan yang berbeza. Tambahan pula, sintesis bunyi yang tidak tepat (cth dalam pernafasan atau serak) juga dianggap sebagai salah satu punca utama kemerosotan prestasi, yang membawa kepada bunyi sementara yang bising dan ketakselanjaran temporal dalam pertuturan yang disintesis. Untuk mengatasi isu ini, cNM baharu dibangunkan berdasarkan sisihan herotan fasa untuk mengurangkan kesan persepsi bunyi sisa, membolehkan pembinaan semula ciri hingar yang betul, dan model segmen suara berderit yang mungkin berlaku dalam pertuturan semula jadi dengan lebih baik. Untuk tujuan ini, cNM direka bentuk untuk memastikan hanya komponen suara dalam keadaan ambang cNM sambil membuang yang lain. Kami menilai pendekatan yang dicadangkan dan membandingkan dengan vocoder terkini menggunakan ujian pendengaran objektif dan subjektif. Keputusan eksperimen menunjukkan bahawa kaedah yang dicadangkan boleh mengurangkan kesan sisa hingar dan boleh mencapai kualiti pendekatan canggih lain seperti STRAIGHT dan model nadi domain log (PML).

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E103-D No.5 pp.1099-1107
Tarikh penerbitan
2020/05/01
Diumumkan
2020/02/10
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2019EDP7167
Jenis Manuskrip
PAPER
kategori
Pertuturan dan Pendengaran

Pengarang

Mohammed Salah AL-RADHI
  Budapest University of Technology and Economics
Tamás Gábor CSAPÓ
  Budapest University of Technology and Economics,MTA-ELTE Lendület Lingual Articulation Research Group
Géza NÉMETH
  Budapest University of Technology and Economics

Kata kunci

Contents [show]