Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Esophageal Speech Enhancement Based on Statistical Voice Conversion with Gaussian Mixture Models Peningkatan Pertuturan Esofagus Berdasarkan Penukaran Suara Statistik dengan Model Campuran Gaussian

Hironori DOI, Keigo NAKAMURA, Tomoki TODA, Hiroshi SARUWATARI, Kiyohiro SHIKANO

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Makalah ini membentangkan kaedah baru untuk meningkatkan pertuturan esofagus menggunakan penukaran suara statistik. Pertuturan esofagus adalah salah satu kaedah pertuturan alternatif untuk laryngectomees. Walaupun ia tidak memerlukan sebarang peranti luaran, suara yang dihasilkan biasanya kedengaran luar biasa berbanding dengan pertuturan biasa. Untuk meningkatkan kefahaman dan keaslian pertuturan esofagus, kami mencadangkan kaedah penukaran suara daripada pertuturan esofagus kepada pertuturan biasa. Parameter spektrum dan parameter pengujaan pertuturan normal sasaran dianggarkan secara berasingan daripada parameter spektrum pertuturan esofagus berdasarkan model campuran Gaussian. Keputusan eksperimen menunjukkan bahawa kaedah yang dicadangkan menghasilkan peningkatan yang ketara dalam kebolehfahaman dan keaslian. Kami juga menggunakan penukaran suara eigen satu kepada banyak kepada peningkatan pertuturan esofagus untuk membolehkan anda mengawal kualiti suara pertuturan yang dipertingkatkan secara fleksibel.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E93-D No.9 pp.2472-2482
Tarikh penerbitan
2010/09/01
Diumumkan
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.E93.D.2472
Jenis Manuskrip
Special Section PAPER (Special Section on Processing Natural Speech Variability for Improved Verbal Human-Computer Interaction)
kategori
Penukaran Suara

Pengarang

Kata kunci

Contents [show]